總有一天 DeepMind 會帶領 AI 刷榜所有遊戲

  • 2019 年 12 月 1 日
  • 筆記

By 超神經

Google 家的 Deep mind AI 團隊又搞出一件大殺器,訓練 AI 挑戰人類的空間感知能力,真的在一場迷宮遊戲中他們擊敗了專業的人類玩家。

細思恐極,未來我們玩遊戲時,對面的玩家是人還是 AI 真的分不清了,最好不要教 AI 裝女聲小姐姐來欺騙我們的感情。

Deepmind 是如何做到的呢?

熟讀《孫子兵法》的 Deep mind 從 Alpha Go 開始,就深諳知己知彼的道理,因此,想要讓AI具備像人一樣的導航能力,就必須先弄清人腦是如何導航的。

人腦如何導航?

探索人腦的奧秘可以說是一件難度係數 9.9 以上的任務,但站在巨人肩上的 Deep mind 不費吹灰之力就找到了問題的答案。

這裡要特別感謝 2005 年諾貝爾生理或醫學獎獲得者英裔美國科學家 John O'Keefe(約翰·奧基夫),及來自挪威的 May-Britt (梅-布里特)和他的丈夫 Edvard Moser(愛德華·莫澤)。

通過不懈努力歷經千辛萬苦,他們找到人腦 GPS 的核心——「網格單元」,這讓 Deep mind 輕鬆發現人腦空間感知的關鍵。網格單元是一種神經元組織,由無數個網格細胞構成,主要功能是幫助人類及大多數哺乳動物給自己定位和導航。

當我們在移動時,網格單元會不斷更新當前所在位置和周邊環境,並記錄下行走路徑和歷史位置,然後在大腦里繪製出一張虛擬地圖,幫助大腦確定位置和方向。

每到一個新的地方,網格細胞就會自動繪製一張新的地圖。也就是說你到過的地方越多,這張地圖就越全,你的空間感知範圍也就越大。

AI版網格單元

在該成果的啟發下,Deep mind 團隊聯合 UCL(倫敦大學學院)科學家,共同開發出一套遞歸神經網絡系統。該系統在模擬小白鼠尋找方向的過程中,神奇的發現神經網絡產生了類似網格單元在確定位置時的一些特徵。

(圖註:神經網絡生成的網格單元跟人類很類似)

通過進一步研究和改進,他們成功打造出神經網絡版網格單元(也叫AI網格單元)。AI 網格單元不僅能判斷自身位置,還能在複雜的環境里找到通向目標點的最佳路線。

這個發現讓 Deep mind 團隊喜出望外,他們迫切需要一次機會來秀一把真正的技術。於是,團隊決定跳過小白鼠和大猩猩,直接向人宣戰。

在一場與專業玩家對戰的迷宮游戲裏,搭載神經網絡版網格單元的AI不僅在複雜的環境里找到方向,還準確計算出到目標點的距離,並找到最快行進路線(包括其他一些耗時較長的路線),成功戰勝人類。

雖然只是在虛擬環境中取得勝利,但這意味着 AI 有能力在不藉助 GPS 等外部數據的前提下,在實際場景中找到方向。因此,Deep mind 刷存在的同時,也不可否認這是一次里程碑式的勝利。

此前,AI 僅被證明在圖像識別、棋牌遊戲等領域有過人之處,但很少能在像導航這種主觀認知領域超越人類。而這次 AI「進化」出自動導航功能,證明 AI 不僅能複製大腦,還能很好的理解大腦。

可以遇見的是,在未來 AI 將擁有更多可能性。依靠其強大的計算和學習能力,它能對同一個問題得出若干種解決方案,並找出最佳答案。

這對那些糾結中午該吃什麼的人,真是天大的福音。

當然要是不斷去訓練 AI 適應各種遊戲環境,再配上 Google Assistant 真假難辨的聲音,怕我們更難分清對面的遊戲玩家,究竟是個小姐姐還是 AI 了。

Sad.