Python文字轉換語音,讓你的文字會「說話」,摳腳大漢秒變撒嬌萌妹

  • 2019 年 11 月 12 日
  • 筆記

APP 也有文字轉換為語音的功能,雖然聽起來很彆扭,但是基本能解決長輩們看不清文字或者眼睛疲勞,通過文字轉換為語音來獲取資訊。

我們用 Python 能否實現文字轉語音呢,可以的,百度有個語音介面,可以在 Python 中直接調用,甚至提供了多種聲音選擇,當然可以選擇萌妹子的聲音。

安裝百度介面

通過 pip 命令直接安裝( -i 後面是豆瓣的鏡像,這樣下載安裝速度更快)

pip3 install baidu-aip -i https://pypi.douban.com/simple/

創建應用

百度語音合成地址如下:

https://ai.baidu.com/tech/speech/tts

點擊立即使用,沒有登錄的會要求先登錄,用自己的百度的帳號登錄就可以,沒有百度帳號的新註冊一個。

登錄後進入應用頁面,語音識別包括:輸入法、搜索、英語、粵語、四川話、遠揚,還有語音合成等庫。我們可以看到,大部分 API 的調用次數免費且無限制的。

我們創建一個應用,勾選需要的介面許可權,我的要求比較簡單,只是簡單的文字轉語音,所以勾選的介面也比較少。當然,這個介面還可以做人臉識別、影像識別、自然語言處理等,大家按需選擇。

創建完成後,我們在應用列表可以看到應用的三個重要的值:AppID、API Key、Secret Key,這三個值等下調用介面時會用到。

在文檔中心,我們來看看基本的上傳參數。

程式碼調試

根據介面文檔,我們寫個簡單的程式碼,能夠調通介面就行。

我們需要填入你創建應用的 APP_ID、API_KEY 和 SECRET_KEY 的值。

其中,per 的值表示男女聲的,0 和 1 是普通的女聲和男聲,聽起來有點彆扭,3 和 4 是帶有感情的,明顯比 0 和 1 有感情,大家可以試試。

from aip import AipSpeech    APP_ID = '17657240'  API_KEY = 'YRG9NQ6lVQYOXeazzK9rAovG'  SECRET_KEY = 'TlG8tchxR3YFGg0hFuC3ODy2QvRafc2v'    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)    # 中文:zh 粵語:ct 英文:en    result = client.synthesis('哈哈哈哈', 'zh', 1, {      'vol': 5, 'per': 4  })    # 識別正確返回語音二進位 錯誤則返回dict 參照下面錯誤碼  if not isinstance(result, dict):      with open('audio.mp3', 'wb') as f:          f.write(result)  

執行程式碼後,同級目錄下就會生成一個 audio.mp3 的文件。

秒變撒嬌萌妹

我們加入金山詞霸的介面,每天返回優美的英文和中文翻譯語句,我們讓度丫丫把她讀出來,讓聲音秒變撒嬌萌妹。

金山詞霸的介面很簡單,直接 requests 調用,返回的 json 格式語句,我們返回英語語句和中文語句。

def get_msg():      url = 'http://open.iciba.com/dsapi/'   # 金山詞霸每日一句 api 鏈接      html = requests.get(url)      content = html.json()['content']   # 獲取每日一句英文語句      note = html.json()['note']   # 獲取每日一句英文的翻譯語句      return content, note

給出 APP_ID、API_KEY 和 SECRET_KEY 的值。

下面的步驟和上面一樣,只是把上面固定的文本換成介面返回的金山詞霸的語句而已。

我們打開文件,還能聽出一些撒嬌聲,不信?你打開聽聽!

我發文章的時候,金山詞霸返回的中文語錄是:事情很少是不可能的;人們之所以不成功,與其說是條件不夠,不如說是決心不夠。

接下來,就可以把這個撒嬌萌妹的音頻 發微信給朋友 或者免費發簡訊給朋友 都可以,之前講過,這裡就不再啰嗦了。