總結 | 狗尾草智能科技邵浩:從 0 到 1 構建聊天機械人

  • 2019 年 10 月 31 日
  • 筆記

AI 科技評論按:近年來,無論是聊天機械人技術,還是相關產品,都發展的非常迅速。近日,在雷鋒網 AI 研習社公開課上,深圳狗尾草智能科技有限公司 AI Lab 主任邵浩系統性闡述聊天機械人的技術挑戰,討論聊天機械人理論的最新進展,介紹如何從零構建一款可用的聊天機械人,以及打造聊天機械人落地產品中需要注意的技術細節。

公開課回放視頻網址:

http://www.mooc.ai/open/course/585?=shaohao

分享嘉賓:

邵浩:深圳狗尾草智能科技有限公司 AI Lab 主任,日本國立九州大學博士,中國中文信息學會青工委委員,中國計算機學會 YOCSEF 上海學術委員會委員,研究方向為人工智能和機器學習,發表論文四十餘篇。

分享主題:從 0 到 1 構建聊天機械人

分享提綱:

1、聊天機械人關鍵技術及挑戰 2、從 0 到 1 構建可用的聊天機械人 3、從認知到感知:知識圖譜的核心作用 4、Gowild AI lab 簡介,總結與討論

AI 研習社將其分享內容整理如下:

雖然《從 0 到 1 構建聊天機械人》這個公開課標題起得有點唬人,但是還是希望大家通過這堂課了解我們公司相關團隊在做聊天機械人時所遇到的一些問題和挑戰,及相應的解決方案。

本次的分享分為三個部分,包括:

  • 了解 Chatbot 的技術體系
  • 如何從零構建一個可用的 Chatbot
  • 討論一些主流的理論技術及挑戰——主要與深度學習相關

Chatbot 的技術體系

首先看一下為什麼要做聊天機械人,這要從上世紀 80 年代起我們所經歷過的四個時代說起:

第一個時代是 IT 時代,這是個人電腦出現的時代,它的特點是「運算力改變生活」,當時最具代表性的公司是微軟和 IBM;

第二個時代是互聯網時代,這個時代最典型的特徵就是「連接顛覆一切」,當時最具代表性的公司就是 Google;

第三個時代是移動互聯網時代,其最典型的特點是「數據利用效率的提升,和交互方式的改變」:數據利用效率方面的典型應用場景就是我們可以通過手機點外賣、叫車,這在以前是無法實現的事情;交互方式則從按鍵式交互變化到觸屏交互。這個時代的代表性公司是蘋果。

自從 Alpha Go 戰勝李世石,我們就進入了最新的一個時代——AI 時代。這個時代所對應的入口就是語音對話產品。微軟在 2016 年開發者大會上提出了「對話即平台」的口號,他們認為對話是人類最自然的交互方式,這也是為什麼各大科技巨頭都在競相發力聊天機械人領域的原因。

那 2016 年到 2018 年兩年的時間過去了,聊天機械人市場發生了什麼?有句話叫做「忽如一夜春風來,千樹萬樹梨花開」,我們可以看到市場上出現了大量的聊天機械人,有大家熟悉的 Echo、小米音響、天貓精靈以及我們公司的公子小白等等。其中,小米還出了一款 49 元的音箱,這肯定是不盈利的,那為什麼各大廠商還是大力投入呢?主要是因為它們都想通過聊天機械人搶佔 AI 時代的主入口——有了入口和流量,才能在上面做很多文章。

做聊天機械人的第一步就是選擇想做什麼類型的機械人。我們這裡分為兩個層次、四種類型:

主動交互是每個廠商都希望能做到的,它指機械人能在合適的時間和地點,以合適的方式進行主動的對話,實現信息共享與推薦。

被動交互則是目前大家接觸最多的一種交互方式,主要有三種類型:

  • 第一種是聊天(閑聊)機械人,比如小冰;
  • 第二種是問答系統,如 IBM 的 Watson,可以回答一些事實型和非事實型的問題;
  • 第三種是面向任務/目標的對話系統,比如當用戶需要訂機票、點外賣時,機械人就需要在對話中確定某項目標或任務。

後兩類交互方式的一個主要區別在於:問答系統通常是單輪的,而面向任務/目標的對話系統通常是多輪的。

那又怎樣區別聊天(閑聊)和面向任務/目標的對話系統呢?

(關於區別聊天(閑聊)和面向任務/目標的對話系統的具體講解,請回看視頻 00:12:00 處)

從 0 到 1 構建可用的聊天機械人

下面看一下怎樣真正地從 0 到 1 去構建聊天機械人。我們以聖鬥士的不同階段為例進行闡述。

第一個階段是聖鬥士候補階段,這個階段我們強調的是,你可以沒有 NLP 基礎、工程能力、機器學習能力以及知識圖譜能力,但你依舊可以搭建一個非常簡單的聊天機械人。我們可以通過一些現有的平台去實現機械人的閑聊能力和其他技能。(實操平台:http://ruyi.ai)

第二個階段是青銅聖鬥士階段,這個階段不要求你具備很多算法知識,但需要你對 NLP 有所了解。你可以通過複雜平台去構建任務型對話,其中就涉及到「多輪」和「詞槽」的概念。(實操平台:https://ai.baidu.com/unit/home)

第三個階段是白銀聖鬥士階段,這個階段要求有一定代碼能力,對 NLP 有了解,可以自己動手去構建聊天機械人。

首先,自己可以創建一個對話語料庫,然後使用 Python 進行文本處理,其中可以用到的一個比較經典的框架是 IR 框架:

其中,在匹配模型的構建方面,可以使用深度學習的方法去實現匹配:

  • 一個方法是基於表達的——Weak interaction models
  • 另一個方法是基於交互的——Strong interaction models

第四個階段是黃金聖鬥士階段,這個階段要求你可以使用代碼完全實現一個文字型的對話機械人。

這裡就需要有一個非常明確的架構設計:

目標就是綜合各種手段去實現聊天機械人 NLU、對話管理,NLG 以及各種功能:

第五個階段是掌管者階段,需要更加深層的能力,包括構建生成模型和語言模型。

第六個階段是神的階段,這個階段除了對 NLP、工程、機器學習以及知識圖譜能力方面有要求,還要求具備強大的團隊實力。一個好的產品是各方面的妥協,需要從產品、性能以及成本等維度進行綜合考量。

(關於從 0 到 1 去構建聊天機械人的每個階段的具體講解以及每個階段所對應的實操演示,請回看視頻 00:15:00—00:49:40 處)

事實上,很多創業公司都是「A 輪死」,為什麼?在 A 輪前,創業公司獲取現金流有兩種方式:一種是通過創始人、團隊和技術來賣「期望」拿投資;另一種是將「期望」轉化為「產品」,賣「現實」拿收入。而 A 輪之後,投資人更看中的是技術變現能力,看具體的營收數字。

然後聊天機械人創業團隊還要考量的問題是,機械人要不要考慮多輪對話,這就涉及到多輪架構的構建,一般難度比較大。

Gowild AI lab 簡介,總結與討論

最後跟大家介紹一下我們公司,Gowild 是 AI 公司裏面娛樂實力比較強的公司,也是娛樂公司中 AI 實力比較強的公司。

分享結束後,嘉賓還對聽眾的提問進行了解答,大家可回看視頻 00:55:00 處

以上就是本期嘉賓的全部分享內容。更多公開課視頻請到雷鋒網 AI 研習社社區(http://ai.yanxishe.com/)觀看。