全球首個AI實時翻譯直播上線,全世界人民都可以在直播間里聊天。

10月21日,阿里完成全球首個多語言實時翻譯的電商直播,該直播展示了AI無懼嘈雜環境、口音不標準及口語化語言風格等問題,實時將中文直播內容精準翻譯成英語、俄語、西班牙語等語言。阿里方面透露,該技術將大規模應用於2020雙11。

達摩院AI可實時翻譯直播內容及評論區的小語種語言


「語言」問題是不同地域商家和買家之間難以跨越的大山。數據顯示,速賣通上約96%的中小企業無小語種翻譯能力,而通常一個直播間就覆蓋了十多個語種,82%的中國商家因此而放棄跨境直播。

儘管AI能輔助文本翻譯,但直播場景的翻譯任務更加複雜,它需要先後進行語音識別和翻譯兩個過程,並要克服口音不標準、口語化表達、直播環境嘈雜、商品專業名詞多、新品新詞更迭快等問題。例如,」然後我們的話新品大家的評價也看了」是一句口語化的句子,正確的翻譯應為」Then we have read everyone』s comments on new products」,但傳統的翻譯引擎很容易錯誤地翻譯成」Then we also looked at our comments on new products」(然後我們也看了我們對新品的評價)。

為解決機器聽不清、聽不懂的問題,阿里在業界通用方案的基礎上自研了更智慧的語音模型,可在嘈雜的環境中」聽清」直播內容;同時,在AI翻譯任務過程中創新性集成了視覺資訊的識別結果,可將口語化句子改寫成正式表達句子;此外,達摩院將多領域的知識融入翻譯模型,能舉一反三,無需重新訓練便能快速學習不同場景里不斷更迭的專業名詞。

過去幾年,阿里AI翻譯技術歷經多次迭代升級,目前可提供214種語言的高品質翻譯,一天可翻譯3000億個詞語。並創造多項世界紀錄,曾獲2018國際機器翻譯大賽(WMT)翻譯任務5項語向冠軍,品質評估任務6項冠軍,30多項相關研究成果被國際AI高峰會收錄。同時,該技術也逐步應用於阿里巴巴內部及外部企業客戶,日均調用量超過13億次。

達摩院機器翻譯團隊負責人駱衛華表示,」讓機器聽清、聽懂是實現精準翻譯的基礎,達摩院希望通過創新的AI演算法繼續攻克電商、教育、醫療等專業領域的翻譯難題,幫助人類跨越語言障礙。」