SpeechRecognition

Eric讨论 | 贡献2024年2月23日 (五) 02:10的版本 →‎保存音频文件
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

SpeechRecognition是一个开源的Python 语音识别库,支持多个语音识别引擎和API,可以在线和离线识别。

简介

时间轴

安装

使用pip安装:

pip install SpeechRecognition

了解更多 >> PyPi:SpeechRecognition


快速入门

语音识别引擎

SpeechRecognition支持下面的在线或离线的语音识别引擎。

了解更多 >> GitHub:SpeechRecognition


示例

保存音频文件

以下示例,通过麦克风录音,保持为音频文件。录音使用到PyAudio,需要先安装。

import speech_recognition as sr

# 从麦克风获取音频
r = sr.Recognizer()
with sr.Microphone() as source:
    print("可以开始说话了。")
    # timeout:指定等待时间(秒),默认None一直等待。
    # phrase_time_limit:最长输入时间(秒),默认None没有时间限制。
    audio = r.listen(source, timeout=15, phrase_time_limit=50)

# 存储为wav格式,还可以存储为raw,aiff和flac格式。
with open("microphone-results.wav", "wb") as f:
    f.write(audio.get_wav_data())

了解更多 >> GitHub:speech_recognition/examples/write_audio.py


资源

官网

网站

文章