Python語音交互的實現

實現前提

在windows10上運行的測試內容。 Python版本:Python3.6.2。 已經註冊並添加了百度的'』語音識別'和'語音合成'應用。 已經註冊並創建了圖靈機器人的'機器人'。

整體的實現流程

  1. 語音輸入。
  2. 語音翻譯成文字。
  3. 聊天回應文字。
  4. 將文字合成語音。
  5. 輸出語音。

實現方式

  1. pyaudio模組識別麥克風
  2. 在線百度語音識別,把錄音文件轉換成文字
  3. 在線圖靈機器人,對文字進行回答
  4. 使用百度的語音合成技術,把文字轉為音頻文件
  5. 通過pygame識別音頻(只能是MP3格式),輸出語音

外部包

pip install pyaudio==0.2.11  pip install baidu-aip==2.2.5.2  pip install pygame==1.9.4

項目在github上的地址

https://github.com/feature09/speech_interaction_demo.git

使用

克隆下來後,更改main.py中的百度key和圖靈key,執行main.py,直接使用。


可以結合語音喚醒,自己製作一個智慧音箱了。 語音喚醒內容:[https://blog.51cto.com/feature09/2300352]