知行迭代
导航
首页
最近更改
随机页面
常用
分类目录
Linux命令
Mediawiki常用
电脑技巧
工具
链入页面
相关更改
特殊页面
页面信息
登录
查看“智能音箱”的源代码
←
智能音箱
页面
讨论
阅读
查看源代码
查看历史
因为以下原因,您没有权限编辑本页:
您请求的操作仅限属于该用户组的用户执行:[
[1]
]
您可以查看和复制此页面的源代码。
智能音箱是一种内置语音助手的智能音响,可以接收语音指令,进行播放音乐、对话问答,控制家庭设备等。 ==简介== ===时间轴=== ==常见产品== {| class="wikitable" ! 产品 ! 虚拟助手 ! 公司 ! 描述 |- | 天猫精灵 | [https://www.aligenie.com/ AliGenie] | 阿里巴巴 | |- | 小度 | [https://dueros.baidu.com/open DuerOS] | 百度 | |- | 小爱同学 | [https://developers.xiaoai.mi.com/ 小爱同学] | 小米 | |- | | | | |- | Echo | [https://www.alexa.com/ Alexa] | 亚马逊 | |- | HomePod | Siri | 苹果 | |- | | | | |} == 硬件 == == 技术 == === 语音前端处理 === 语音前端处理(Audio Processing) === 唤醒 === 唤醒,也称Keyword Spotting (KWS), 即关键词检测。当录音识别到关键词(如设置'天猫精灵','hey Siri'),就开始录制后面的语音,进行分析处理。 {| class="wikitable" ! 名称 ! 描述 |- | [[Picovoice#Porcupine | Porcupine]] | 是一款离线轻量级的唤醒词引擎,支持多语言,多平台。免费账号每个月只支持3个用户和3个唤醒词训练。 |- | SnowBoy | |- | 讯飞语音唤醒 | 免费版10个用户90天试用期。<br />官网:https://www.xfyun.cn/service/awaken?type=awaken |- | | |} ===语音转文本=== 语音识别(Automatic Speech Recognition, ASR),也称语音转文本(Speech To Text,STT)。 {| class="wikitable" ! 名称 ! 开发者 ! 描述 |- | whisper | OpenAI | 是OpenAI在2022年9月开源的语音识别 (ASR)软件。可以用于本地离线识别,或安装在服务器上提供API。<br />支持语言:中文、英语、法语、德语、俄语、日语等几十种语言。 <br />价格:免费。 <br />官网:https://openai.com/index/whisper/ <br />源代码:https://github.com/openai/whisper |- |OpenAI<br />语音识别API | OpenAI | 基于开源 large-v2 Whisper 模型。<br />支持语言:中文、英语、法语、德语、俄语、日语等几十种语言。 <br />价格:收费 <br />官网:https://platform.openai.com/docs/guides/speech-to-text/speech-to-text |- | | | |- | | | |- | | | |- | | | |} ===自然语言理解=== 自然语言理解 (Natural Language Understanding, NLU) ===文本转语音=== 语音合成, ==项目== {| class="wikitable" ! 名称 ! 描述 |- | Mycroft | https://github.com/MycroftAI/mycroft-core |- | wukong-robot | 是一个开源的中文语音对话机器人/智能音箱项目。 https://wukong.hahack.com/ |- | | |} ==资源== ===网站=== ===文章=== *[https://github.com/voice-engine/make-a-smart-speaker/blob/master/zh.md Github:voice-engine/make-a-smart-speaker DIY智能音箱]
返回至“
智能音箱
”。