人工智慧中的「五大門派「

美國的佩德羅·多明戈斯寫了一本書《The Master Algorithm》,中文名為《終極演算法》。多明戈斯是華盛頓大學的終身教授,也是一位在機器學習領域具有20 年研究經歷的資深科學家,一直致力於融合各種機器學習演算法的優勢,提出一種可以解決所有應用問題的通用演算法,即終極演算法。這本書也進入了16年比爾蓋茨的推薦書單,書中介紹了人工智慧中典型的幾種「門派」。

他提到平常我們的知識來自三個方面:

  1. 進化:存儲在你的基因(🧬)中
  2. 經驗:存儲在人的大腦神經元
  3. 文化:從周邊的人和事物中學習

這三種方式,每一種都比前一種包含的資訊量大,而且學習速度更快。但是如今出現了第四種學習方式:電腦。電腦能幫助我們發現一些知識。Yann LeCun,甚至說:「未來大部分知識都會被機器提取出來,也會存儲在機器里」。可見未來機器學習會越來越重要。

讓電腦學習的方法大致有五種,而且每個領域有一個主演算法。

1. 符號派

符號派的靈感來源於邏輯學、哲學。一定程度上來說,是最「電腦科學」的,他們的目標是填補已有知識中的空缺部分。他們的工作跟科學家的工作模式類似:做大量觀察,然後提出假設來解釋他們,通過後續的論證來看是合理的或者不合理的。

自1955年 人工智慧(Artificial Intelligence) 被正式提出以來,符號派就存在了,如上所述,都是基於規則的系統,絲毫沒有「學習」的能力。

這個門派的主打演算法是反向推論(Inverse Reduction):通過已經收集的數據來創建一些規則,然後用規則來推斷將來要發生的事情。然而這個理論有個非常明顯的缺陷,你知道在哪裡嗎?

2. 連接派

連接派是在上個世紀80年代湧現,靈感來源於模擬人腦:它通過模擬人腦的工作方式來讓機器獲得知識。人腦會存儲數據,通過每天不斷獲取新的數據來積累學習。這些記憶的數據的權重各不相同,而且當再次被使用到時會被加強。

這種演算法的問題是人腦非常複雜,想要完整模擬出人腦演算法還有非常長的路要走,需要依賴於基礎學科的突破。

鏈接派的主打演算法是神經網路,其中的分支深度學習(Deep Learning)如今在圖片和影片領域發展非常迅速,應用很廣泛。有很多框架可以支援神經網路分析,包括 Pytorch,TensorFlow、Caffe 和 百度 Paddle 等。這些框架的工作原理都類似:通過迭代分析大量樣例數據來使用分層的方式發掘數據中的特點,把結果從一層傳遞到下一層做下一步分析。每一層能從數據中解析出更複雜、抽象的特點。

神經網路的問題之一是需要大量標註好的數據來訓練演算法,有一些場景下這是不可能做到的。其中用到的反向傳播技術,被詬病的是找到的是「好」的方案而不是「最佳」方案,因為它找到的是局部而非全局最優解。

3. 進化派

一定程度上說進化是一個比人腦更大的學習演算法,因為:

  1. 它創造了人腦
  2. 它創造了地球上其他生物形態

所以值得探究它到底是如何工作的,然後在電腦上實現它。

進化派希望在電腦領域模擬出進化過程:讓自然選擇,適者生存,猶如達爾文觀察到的那樣。其過程是一次(一代)運行數以百萬個不同的解決方案/演算法,其中結果最好的方法保留到下一代。下一代里通過把上一代演算法結合到一起來創建一個新的演算法。這種每一代都有變化的方式會讓我們一步步逼近解決問題的理想演算法。

進化派的主打演算法是基因編程 (Genetic Programming)。這種演算法的缺點是一個演算法產生後,只能等待下一代時才能產出一個更好的演算法。

4. 貝葉斯派

貝葉斯派來源於概率統計領域,想系統地減少不確定性。

其實人類學習到的知識並不是一成不變的,它是不確定的在動態變化的。當我們從數據中推理出一些東西,是無法完全確定就是這樣的。所以學習的方法變成通過使用概率來量化不確定性,當你看到了更多的證據,那不同假設的概率就在隨之調整,證據越多的概率越高。其中方法之一就是大名鼎鼎的貝葉斯理論。

好處是不需要大量的數據集,而且研究院也更容易理解和解釋訓練結果和機器決策過程,甚至可以調整結果。一些使用貝葉斯技術的試驗在識別物體方面也有好的結果。

5. 類比派

這個學派主要源於心理學,使用的是最簡單,最直觀的方式:通過類比來推理。心理學中有大量證據表明人類就是這樣做的:當你面對一個新問題,你會從已有的經驗中找到與之類似的情況,然後把解決方法拿過來解決現有問題。

主打演算法是內核機器 (Kernel Machines),比如支援向量機(Support Vector Machine)是其中演算法之一,它是一種 Kernel 技巧,能把本來非線性的分隔問題影射到線性平面。

其實除了上述五大門派,還有人在 ycombinator 上總結了機器學習里的其他各大門派。如果對這本書感興趣,可以在youtube上看作者16年在Google的演講

參考資料:

  1. The Master Algorithm | Pedro Domingos Talks at Google
  2. An Overview of Pedro Domingo』s The Master Algorithm
  3. AI’s Factions Get Feisty. But Really, They』re All on the Same Team

歡迎關注我的微信公眾帳號,會在第一時間更新,部落格園上只有部分文章會發布

code