分享一次批量文檔翻譯的開發過程

2020 年 9 月 10 日
筆記
人工智能, 新技術嘗鮮, 翻譯

分享一次批量文檔翻譯的開發過程

最近工作過程中，需要對一批文件進行漢譯英的翻譯，對單個文檔手工複製、粘貼的翻譯方式過於繁瑣，考慮到工作的重複性和本人追求提高效率、少動手（懶），想通過調用已有的接口的方法，自己實現一個批量翻譯工具，一勞永逸。在網上找了幾款翻譯api，通過對比翻譯的結果和學習成本，選擇了有道智雲的服務，自己開發了一個批量翻譯的小軟件。詳細記錄一下使用和開發過程，後面的小夥伴們有相關需求，可以參考。

批量文檔翻譯工具的使用

我這裡開發批量文檔翻譯工具使用python作為開發工具，功能如下：

1）通過文件夾選擇多個文檔；

2）可以將多個文檔的翻譯結果存到目標文件夾下。

話不多說，看圖↓↓↓↓↓

部分翻譯結果展示（涉及工作內容的保密性，這裡用荷塘月色作為樣例）：

開發過程

下面開始詳細介紹調用有道智雲API接口的步驟和軟件開發的過程：

1、個人開發者賬號註冊

首先，需要註冊個人的開發者賬號。

在官網點擊註冊，然後填寫個人資料。即可完成註冊，官網地址：//ai.youdao.com/gw.s

2、創建應用和實例

註冊成功並登錄後個人中心頁面如下圖，有道智雲提供了自然語言翻譯、文字識別、語音合成、語音測評等服務接口。這些服務接口都是通過以實例的方式運行的，通過應用進行管理的。需要分別創建實例、創建應用，通過應用獲取應用ID和應用密鑰等信息。

我這裡用到的是自然語言翻譯服務，首先，需要分別創建一個應用、創建一個自然語音翻譯的實例；其次，需要將實例綁定到應用上。最後，就可以通過應用的應用ID、應用密鑰調用自然語音翻譯api接口了。有道平台會對不同的實例、應用的使用情況進行記錄、分析、收費。剛剛註冊的體驗者會有免費體驗字數和50元的體驗金哦（加客服貌似還會有額外的50元的）。

創建實例的步驟：

根據使用需求，選擇對應服務（「自然語言翻譯」/「文字識別OCR」/「語音合成TTS」/「語音識別ASR」/「智能語音評測」/「多平台編輯器」）->「創建實例」，按步驟完成實例創建。

創建應用並綁定實例（應用接口分為三種：API、安卓、ios接口）:

點擊「應用管理」->「我的應用」->「創建應用」，填寫應用名稱等相關信息，選擇接入方式，並綁定我們所創建的實例，完成應用創建。我們這裡用到的是API方式接入，安卓、ios接口需要根據提示填寫相應的信息，詳見官網新手指南。

應用創建成功後，可獲取應用ID（appKey）和應用密鑰等信息，這些信息是調用API接口必不可少的參數。

3、接口調用及代碼實現

1）API接口介紹

下面介紹API接口的調用方法

文本翻譯API HTTPS地址：//openapi.youdao.com/api

調用規則：在調用集成文本翻譯API時，需遵循以下規則。

規則	描述
傳輸方式	HTTPS
請求方式	GET/POST
字符編碼	統一使用UTF-8 編碼
請求格式	表單
響應格式	JSON

調用傳參：調用API需要向接口發送以下字段來訪問服務。

字段名	類型	含義	必填	備註
q	text	待翻譯文本	True	必須是UTF-8編碼
from	text	源語言	True	參考下方支持語言 (可設置為auto)
to	text	目標語言	True	參考下方支持語言 (可設置為auto)
appKey	text	應用ID	True	可在應用管理查看
salt	text	UUID	True	UUID
sign	text	簽名	True	sha256(應用ID+input+salt+curtime+應用密鑰)
signType	text	簽名類型	True	v3
curtime	text	當前UTC時間戳(秒)	true	TimeStamp
ext	text	翻譯結果音頻格式，支持mp3	false	mp3
voice	text	翻譯結果發音選擇	false	0為女聲，1為男聲。默認為女聲
strict	text	是否嚴格按照指定from和to進行翻譯：true/false	false	如果為false，則會自動中譯英，英譯中。默認為false

簽名生成方法如下：
signType=v3；
sign=sha256(應用ID+input+salt+curtime+應用密鑰)；
其中，input的計算方式為：input=q前10個字符 + q長度 + q後10個字符（當q長度大於20）或 input=q字符串（當q長度小於等於20）；

返回結果格式：返回的結果是json格式，具體說明如下：

字段名	類型	含義	備註
errorCode	text	錯誤返回碼	一定存在
query	text	源語言	查詢正確時，一定存在
translation	Array	翻譯結果	查詢正確時，一定存在
basic	text	詞義	基本詞典，查詞時才有
web	Array	詞義	網絡釋義，該結果不一定存在
l	text	源語言和目標語言	一定存在
dict	text	詞典deeplink	查詢語種為支持語言時，存在
webdict	text	webdeeplink	查詢語種為支持語言時，存在
tSpeakUrl	text	翻譯結果發音地址	翻譯成功一定存在，需要應用綁定語音合成實例才能正常播放否則返回110錯誤碼
speakUrl	text	源語言發音地址	翻譯成功一定存在，需要應用綁定語音合成實例才能正常播放否則返回110錯誤碼
returnPhrase	Array	單詞校驗後的結果	主要校驗字母大小寫、單詞前含符號、中文簡繁體

當返回的結果errorCode為 0 時說明調用成功，不為0時，則會出現不同含義的錯誤碼。詳細含義可查閱官方開發文檔。

2）批量文檔翻譯開發

批量翻譯demo使用python3實現，為了方便測試，我用tkinter做了簡單的界面，用來讀取待翻譯文檔，指定結果存儲路徑，為了最大化簡化開發過程，降低測試的時間成本，目前只實現了讀取.txt類型文件的方法。

整個demo分為三個文件，mainwindow.py，translate.py和translatetool.py，mainwindow為UI部分的代碼，translate中實現了批量讀取文檔並翻譯保存的邏輯，translatetool為根據示例代碼改造後的翻譯方法，需調用其他平台API時，亦可封裝相應方法，增加了項目的擴展性。

mainwindow的元素如下：

root=tk.Tk()
root.title("netease youdao translation test")
frm = tk.Frame(root)
frm.grid(padx='50', pady='50')
btn_get_file = tk.Button(frm, text='選擇待翻譯文件', command=get_files)
btn_get_file.grid(row=0, column=0, ipadx='3', ipady='3', padx='10', pady='20')
text1 = tk.Text(frm, width='40', height='10')
text1.grid(row=0, column=1)
btn_get_result_path=tk.Button(frm,text='選擇翻譯結果路徑',command=set_result_path)
btn_get_result_path.grid(row=1,column=0)
text2=tk.Text(frm,width='40', height='2')
text2.grid(row=1,column=1)
btn_sure=tk.Button(frm,text="翻譯",command=translate_files)
btn_sure.grid(row=2,column=1)

其中translate_files()方法最終調用了translate類的translate_files()方法：

def translate_files():
    if translate.file_paths:
        translate.translate_files()
        tk.messagebox.showinfo("提示","搞定")
    else :
        tk.messagebox.showinfo("提示","無文件")

類translate定義如下：

import  os
from translatetool import connect

class Translate():
    def __init__(self,name,file_paths,result_root_path,trans_type):
        self.name=name
        self.file_paths=file_paths							# 待翻譯文件路徑
        self.result_root_path=result_root_path				# 翻譯結果存儲路徑
        self.trans_type=trans_type
        
    # 翻譯過程：讀取文件-掉用有道api-解析返回信息-保存
    def translate_files(self):
        for file_path in self.file_paths:
            file_name=os.path.basename(file_path)
            file_content=open(file_path,encoding='utf-8').read()
            trans_reult=self.translate_use_netease(file_content)
            resul_file=open(self.result_root_path+'/result_'+file_name,'w').write(trans_reult)
    def translate_use_netease(self,file_content):
        result=','.join(connect(file_content,'zh-CH','EN'))	 # 翻譯API返回結果為一個數組
        return result

調用有道API主要方法為connect()，根據API的簽名信息等要求組成data並發送請求，解析返回的json：

# input輸入待翻譯字段，fromlanguage待翻譯的語言,tolanguage翻譯成的目標語言
# 返回翻譯的字段
def connect(inputtext,fromlanguage,tolanguage):
    q=inputtext
    data = {}
    data['from'] = fromlang
    data['to'] = tolang
    data['signType'] = 'v3'
    curtime = str(int(time.time()))
    data['curtime'] = curtime
    salt = str(uuid.uuid1())
    signStr = APP_KEY + truncate(q) + salt + curtime + APP_SECRET
    sign = encrypt(signStr)
    data['appKey'] = APP_KEY
    data['q'] = q
    data['salt'] = salt
    data['sign'] = sign
    print(data)
    response = do_request(data)
    print(response.content)
    j = json.loads(str(response.content, encoding="utf-8"))["translation"]
    return j

完整demo代碼地址：//github.com/LemonQH/BatchFileTraslationProgram/tree/master

得益於API的學習成本之低，接口調用部分的開發過程十分順利，僅有一個小插曲，最開始調用API總是返回錯誤碼206（即時間戳錯誤），最後發現是我的系統時間比標準時間慢了十分鐘 – – #

總結

對於我此次的需要翻譯的文檔需求來說，有道智雲贈送的字數和賬戶額度，已經夠用了，但是如果想長期的使用下去，還是要付費的。最後發現，有道智雲在個人主頁中還提供了按小時統計當日實例調用次數和查詢字符數和按天統計歷史天數內實例的調用次數和字符數，對有需求的小夥伴，還可以記錄查看自己接口的翻譯量、實時調用量等狀態。

如上是我整個demo的開發過程。整體來說從註冊到調用有道智雲API的過程還是比較順利的，而且每一步都有官方的詳細文檔可以參照。以至於主要開發時間都分配給了tkinter排版（順便吐槽下tkinter的「好用」 :p)。

Tags: 人工智能新技術嘗鮮翻譯