計算所山世光:AI方法論需升級,疫後 AI 將如何發展?
- 2020 年 4 月 21 日
- AI
雷鋒網 AI 科技評論按:曾被譽為人工智慧的三駕馬車——演算法、算力、數據,到了需要反思的時刻。特別是深度學習在學術前沿的後續發展乏力,恐難支撐AI能力繼續升級。
步入新的十年後,如今 AI 可能已經到了一個拐點時刻。
那麼接下來,AI 技術將如何發展、應用?隨著中國疫情的結束,這逐漸成為領域內眾多研究者和從業者亟需回答的一個關鍵問題。
4 月 9 日,中國科協學會學術部、中國科學報聯合騰訊科協、騰訊發展研究辦公室舉辦了一場非常及時的線上論壇活動,主題為「人工智慧:科技與經濟融合新引擎」。眾多學者專家紛紛回答了疫後人工智慧科技與經濟融合發展的諸多問題。
雷鋒網 AI 科技評論本著對人工智慧技術重點關注,選取中科院計算所研究員、中科視拓創始人山世光的報告內容做以整理,分享給大家。
山世光研究員的報告分為兩大部分,先是從研究的角度,他認為AI方法論將從「數據驅動」轉向「知識+數據聯合驅動」;在後一部分,他從行業發展的層面提出了五大觀點和建議。這些內容具有深刻的洞見性。
1、從學術前沿視角來看,深度學習已成強弩之末
在過去十年里,人工智慧的研究從過去依靠規則、知識來設計人工智慧演算法這樣一套方法論,逐漸過渡到了以數據為主要驅動力的方法論。
在這個方法論的指導下,靠著「三駕馬車」——演算法、大數據、強算力,支撐起了現在的AI能力。演算法上主要以深度學習為主,數據則強調要足夠大(且是有監督的標註數據),由於深度學習動輒需要通過訓練設定上億的參數也導致了非常依賴強大算力的支撐。
於是,只要滿足下面兩個條件的AI任務,都能夠得到好的解決:
1)專用AI任務(而非通用AI)。例如醫療影像中,看肺炎的AI就只能看肺炎,不能看肝炎;看CT的AI就只能看CT,不能看核磁。
2)「好」數據肥沃(通過商業模式大量獲取數據)。所謂好數據,一方面要有較大的規模,另一方面則是要有好的標註。
但這樣的AI,離我們所期望的相距甚遠。
微軟亞洲研究院院長洪小文博士曾提出如下的AI能力金字塔(黃色字體是山世光增加內容):
按照這種金字塔層次,目前的AI技術仍還停留在第二層的「感知和簡單推理」上面,也即相當於非人類靈長類動物的層次。
如何更進一步,向上做到認知、情感、創造,甚至智慧呢?
山世光認為我們至少需要做以下幾種能力的提升——
然而,現有的AI方法論並不足以支撐AI能力繼續升級。
首先,演算法、算力、數據這三架馬車已略顯疲軟。算力提升和大數據收集都需要投入資源,但演算法卻大多是一個模型對一個任務,現在是問題很多,方法卻有限。
其次,深度學習在工業界還在靠大數據和大算力進行應用研究,由於沒有強大的理論支撐,有些算力和數據會浪費在試錯上,這一點現在已經變得越來越明顯。
而另一方面,在學術前沿上,深度學習顯示出的潛力有限。為什麼呢?因為它本身無法克服高度數據依賴問題,無法像人一樣基於「弱」、「小」數據進行精確而且魯棒的學習!現有研究還都寄希望於基於深度學習來解決數據依賴的問題,希望能夠賦予機器學習從弱監督、小數據來學習的能力,但從原理上來說,如果沒有別的數據或知識做支撐,這幾乎是不可能的。我們必須找到全新的方法。
2、未來10年的AI方法論:知識+數據聯合驅動
AI 能力的升級,必須依賴AI 方法論的升級,而這歸結到本質,還是演算法的革新。
山世光研究員提出如下幾種亟需發展的AI演算法——
舉例來說,演算法能否在數據量減小到原來10%甚至1%,同時還保持和原來相當的能力呢?在現有的演算法(純數據驅動)中,是否可以加入知識,或者已有的其他數據或模型,做到知識和數據聯合驅動?……事實上,已經有許多研究單位在做,也是當下AI演算法上最值得探索的幾個研究方向之一。
針對以上內容,山世光從「數據依賴」的角度做了詳細說明。前面提到,當前人工智慧的方法是強大 (強監督、大規模) 數據依賴。但我們知道人類智慧並不是如此,簡單舉幾例人類的能力:
-
歸納和演繹推理:從個別到一般,再從一般到個別;
-
舉一反三&觸類旁通:類似推演&遷移學習;
-
吃一塹長一智:從少量錯誤中學習(修改模型);
-
預測檢驗:時刻預測並修正誤差;自糾錯學習;
-
元方法:道生一,一生二,二生三,三生萬物;
-
融會貫通:多模態、多學科知識校驗和融合;
-
想像力和創造力:無中生有,外插而非內插。
從這些能力中,我們可以看出,人類的智慧本質上是一種知識+弱小(弱監督、小樣本)數據驅動的方法。這種特性值得我們參考。
山世光研究員認為,人類能夠做到小數據的學習,原因在於有知識的積累。因此如何把知識融合到機器當中,對於AI演算法非常重要。這裡的知識既可能是人類總結出的知識,也可以是已有AI學到的知識,他把後面這種知識稱之為「機器知識」。
所謂「機器知識」,不同於「人類知識」,很可能不是人類可閱讀的,甚至不是人類可理解的。如山世光研究員所說,當我們已經用演算法解決了N個任務(例如識別人臉、猴臉、馬臉、狗臉、牛臉等)後,機器就有可能從這些任務中總結出一些通用任務的規則,作為「元」模型。
有了「機器知識」,即使是小數據/無數據的任務,也能夠獲得好的性能。例如可以藉助上述從人 / 猴、馬、狗、牛等學習到的臉部識別模型,得出一個關於臉的「元」模型,用來識別考拉臉、魚臉、熊貓臉等。
(現在的方法則往往是,識別一個動物,就要收集大量這個動物的臉部照片,換種動物就得重新收集和學習,既不高效,也不優雅,甚至笨拙的有點可笑。)
事實上,這種研究本質上是多任務協同的問題,在2018年已經有人在做,CVPR 2018的最佳論文正是其中的代表,這個工作研究了26個不同任務之間的關係,以及如何可以互相支撐,從而減少對標註數據的需求。
基於以上的分析,山世光研究員認為,AI的方法論,在過去十年逐漸變為以強、大數據驅動為主,但接下來的十年或更長時間裡,知識和數據聯合驅動將成為主流。當然這裡的知識,並不僅僅指人類可以理解的知識,也可能是許多人類無法理解的「機器知識」。
3、五大觀點&建議
在報告的後半部分,山世光研究員針對目前中國的人工智慧發展,提出了五大觀點和建議,如下:
1)AI應用研究方面差距不大
中美(歐)之間在應用研究上差距不大,但我們在各行業縱深應用(即在其他研究領域)上仍需努力。例如,AI在生物資訊領域的應用,西方的積澱很多,深度學習也滲透了很多,而中國在這方面就需要努力趕超。
2)AI基礎研究方面差距不容小覷
中美(歐)差距在縮小,但中國加速度不夠。過去十年最具代表性的方法主要還是來自歐美大學或企業,平起平坐恐怕至少還需要5-10年或更久。我們存在的問題在於,對基礎研究長期性的認知不足,缺乏起碼的耐心!重大基礎研究項目評估周期過短,甚至要求技術路線清晰,2年出成果。但基礎研究往往是「無心插柳柳成蔭,有心栽花花不開」。以深度卷積神經網路(DCNN)為例,它是1980年代的產物,過了近20年才開始發揮出威力。
3)AI基礎設施方面差距不小
這包括三個方面,分別是硬體、軟體和智件。
中國在基礎硬體平台上的投入很大,但存在重複建設,尚未形成合力,不能充分發揮效力;另外由於深度學習的理論基礎較為薄弱,無效試錯導致算力浪費的現象也存在。
而另一方面,在基礎軟體平台上中國投入需要提升(相較北美至少落後4-8年),深度學習的主流底層框架(TensorFlow,Pytorch,MxNet)主要還是由北美國家建設,10年後,這方面可能會恰如今日之「晶片產業」,成為我們的「隱患」;最近中國有不少企業單位(百度,華為,曠視,清華,鵬城實驗室…)相繼發布或擬發布開源框架,希望能形成合力。山世光建議,針對低門檻的AI研發平台和工具,我們需要儘快搶佔先機。
此外,山世光建議,我們在基礎智件體系投入上要加大(包括基礎演算法研究),建議加強基礎智件體系研究:從過去已有的計算中心和數據中心開始,如何建設演算法中心,知識中心等,建議儘快建設國家級的「知識中心」,包括人類知識中心(通用知識+領域知識)和機器知識(成熟AI演算法和模型)中心,做到已實現的AI演算法可以像水、電、煤一樣取用,從而避免大量重複勞動。
4)AI人才培養的傾斜力度還不夠
儘管最近大家都說AI人才缺口很大,但實際上AI相關專業的研究生數量仍然不足,這種不足現在主要靠其他非AI專業的學生主動或被動AI化來緩解,這不是長久之計。國家如果真的認為人工智慧是一個戰略方向,應該在AI人才的培養上多一些傾斜,例如分配更多的研究生名額給AI專業。
5)產學研各自定位仍需優化
近些年,我們會注意到一個現象,就是企業大學化,大學和機構企業化。典型的表現就是,企業在發文章,而大學科研機構則在做短期的技術。背後的原因很多,包括對Long-term基礎研究究竟如何評估值得探討,帽子文化也催生了很多快餐式科研成果等。最近國家也不斷的提出要破「四唯」,但更建議不要採取「一刀切」的科研評價模式,應該根據不同的領域、不同的人才類型採取不同的評價方式。此外,對企業科技創新的支援導向性也值得商榷,企業該做什麼樣子的創新,大學和科研機構應該做什麼樣的創新,可能要有一個更加正確的分類。
雷鋒網報道。