Python語音交互的實現
- 2020 年 1 月 7 日
- 筆記
實現前提
在windows10上運行的測試內容。 Python版本:Python3.6.2。 已經註冊並添加了百度的'』語音識別'和'語音合成'應用。 已經註冊並創建了圖靈機器人的'機器人'。
整體的實現流程
- 語音輸入。
- 語音翻譯成文字。
- 聊天回應文字。
- 將文字合成語音。
- 輸出語音。
實現方式
- pyaudio模組識別麥克風
- 在線百度語音識別,把錄音文件轉換成文字
- 在線圖靈機器人,對文字進行回答
- 使用百度的語音合成技術,把文字轉為音頻文件
- 通過pygame識別音頻(只能是MP3格式),輸出語音
外部包
pip install pyaudio==0.2.11 pip install baidu-aip==2.2.5.2 pip install pygame==1.9.4
項目在github上的地址
https://github.com/feature09/speech_interaction_demo.git
使用
克隆下來後,更改main.py中的百度key和圖靈key,執行main.py,直接使用。
可以結合語音喚醒,自己製作一個智慧音箱了。 語音喚醒內容:[https://blog.51cto.com/feature09/2300352]