Python語音交互的實現 - ⎝⎛CodingNote.cc ⎞⎠

Python語音交互的實現

2020 年 1 月 7 日
筆記

實現前提

在windows10上運行的測試內容。 Python版本：Python3.6.2。已經註冊並添加了百度的'』語音識別'和'語音合成'應用。已經註冊並創建了圖靈機器人的'機器人'。

整體的實現流程

語音輸入。
語音翻譯成文字。
聊天回應文字。
將文字合成語音。
輸出語音。

實現方式

pyaudio模組識別麥克風
在線百度語音識別，把錄音文件轉換成文字
在線圖靈機器人，對文字進行回答
使用百度的語音合成技術，把文字轉為音頻文件
通過pygame識別音頻（只能是MP3格式），輸出語音

外部包

pip install pyaudio==0.2.11  pip install baidu-aip==2.2.5.2  pip install pygame==1.9.4

項目在github上的地址

https://github.com/feature09/speech_interaction_demo.git

使用

克隆下來後，更改main.py中的百度key和圖靈key，執行main.py，直接使用。

可以結合語音喚醒，自己製作一個智慧音箱了。語音喚醒內容：[https://blog.51cto.com/feature09/2300352]

Previous post

用Python實現CRUD功能REST服

Next post

OpenStack HA集群3-Pace