智能音箱

智能音箱是一种内置语音助手的智能音响，可以接收语音指令，进行播放音乐、对话问答，控制家庭设备等。

简介

语音前端处理（Audio Processing）

唤醒，也称Keyword Spotting (KWS)，即关键词检测。当录音识别到关键词（如设置'天猫精灵'，'hey Siri'），就开始录制后面的语音，进行分析处理。

名称	描述
Porcupine	是一款离线轻量级的唤醒词引擎，支持多语言，多平台。免费账号每个月只支持3个用户和3个唤醒词训练。
SnowBoy

语音识别（Automatic Speech Recognition, ASR），也称语音转文本（Speech To Text，STT）。

名称	开发者	描述
whisper	OpenAI	是OpenAI在2022年9月开源的语音识别（ASR）软件。可以用于本地离线识别，或安装在服务器上提供API。支持语言：中文、英语、法语、德语、俄语、日语等几十种语言。价格：免费。官网：https://openai.com/index/whisper/ 源代码：https://github.com/openai/whisper
OpenAI 语音识别API	OpenAI	基于开源 large-v2 Whisper 模型。支持语言：中文、英语、法语、德语、俄语、日语等几十种语言。价格：收费官网：https://platform.openai.com/docs/guides/speech-to-text/speech-to-text

自然语言理解 (Natural Language Understanding, NLU)

语音合成，

名称	描述
Mycroft	https://github.com/MycroftAI/mycroft-core
wukong-robot	是一个开源的中文语音对话机器人/智能音箱项目。 https://wukong.hahack.com/