院士回應任正非:解決卡脖子就要造新燈塔
「我們要造新燈塔,照亮新航道。」
這是清華大學人工智慧研究院院長、中國科學院院士張鈸教授,對任正非把基礎研究比喻為燈塔的回應。
也是張鈸教授給當前人工智慧發展提出的新思路,因為新燈塔和新航道,正是他反覆強調的第三代人工智慧。
在紀念《中國科學》創刊70周年的專刊中,張鈸教授以通訊作者發出《邁向第三代人工智慧》文章,指出是時候把第一代的知識驅動和第二代的數據驅動結合起來,通過利用知識、數據、演算法和算力等 4 個要素,構造更強大的人工智慧。
而在量子位的採訪中,張鈸教授進一步解釋了發展第三代人工智慧的重要性、緊迫性,特別是當前在基礎科研方面遭遇「卡脖子」的中國。
張鈸教授還進一步指出了基礎科研和教育中的關鍵挑戰。不僅有國家院士的憂思,還包含了對於人才培養制度的積利除弊,每一個思考都振聾發聵。
為了更加完整展現張鈸教授思考,我們以第一人稱方式呈現本次採訪,內容在不更改原意的基礎上,進行了編輯。方便閱讀的小標題,亦為後添加。
以下是全文:
現在最關鍵是對AI發展現狀的正確評估
當前全世界來講,我們今後從資訊科技走向智慧化、走向人工智慧的前景,無論從社會發展的角度,從經濟發展的角度,大家都有共識。資訊化網路化以後,未來就是智慧化,這個大家沒有太多分歧。
但最關鍵的問題是對發展現狀的評估。
總體來講,至少前一階段,業界估計得過分樂觀。這個也不是第一次,人工智慧整個發展過程中,總體的估計總是樂觀,樂觀以後出問題了就低潮,低潮以後又樂觀,再產生新東西。
本質是對人工智慧的艱巨性認識不足,都以為說我們人的智力很強,既然過去資訊技術發展得那麼快,下一步搞智慧化肯定也會是很快的。
這麼想問題是沒有顧及到,AI要涉及到人的智慧問題,這個是一個很難的問題,我們自己對自己的了解,特別是對大腦的了解太少了,無知就無畏,往往很多東西就把它想得太簡單了。
為什麼講第三代AI?因為中國有歷史性機遇
這段時間,特別是在深度學習出現高潮後,新的樂觀情緒又出來了。
在這種情況下,我在很多場合強調人工智慧才剛剛開始,還處在初級階段,我們的路還很遠還很困難。
剛開始因為大多數人都很樂觀,我也不宜去潑冷水,所以說得比較模糊,後來大多數人逐步認識到過去太樂觀了,所以我也開始講得更加明確。
現在提出第三代人工智慧,非常明確地講,我們的第一代、第二代AI,都只是序幕,都還沒到正戲正劇。
第三代人工智慧才是這個正劇,這個正劇之於中國,機會也很明顯。
第一,歷史上看,就資訊革命而言,它從二戰前後開始,至今差不多有80年,我們有40多年沒有參與其中。
所有關鍵的重要的貢獻,都是外國人做的。電腦理論、電腦、電晶體、積體電路……一路下來,關鍵技術都是人家提出和掌握的,我們一直是後來者、追趕者,追趕極為困難。
解決卡脖子就得「相互依賴」
如果我們一直是跟隨者,能跟上就很不錯了。現在的狀態是基本跟得上,但有些關鍵技術,比如積體電路總是跟不上。
所以問題該怎麼解?
我認為只有抓住新的技術革命,從一開始就是參與者,在當中做出關鍵貢獻,不讓技術完全掌握在別人手裡,有幾個關鍵技術我們做得最好。
比如拿光刻機來講,這裡頭有上千道工序,有大量的製程問題,材料問題,各種各樣的問題……。任何一個國家都不可能掌握其中的所有技術,實際上,光刻機中的關鍵技術被荷蘭、美國、德國和日本等許多國家分別掌握。遺憾的是我們中國不在其中,人家就能卡你。
為什麼形成這個局面?
因為在發展過程中,你都不是參與者,你是旁觀者,到現在才過來追趕,那就非常困難了。
問題不是要求我們去掌握所有技術,而是有一兩項技術你是第一,別人就卡不了你。
真相是你中有我,我中有你,大家互相依賴罷了。日本人掌握了光刻膠技術,所有光刻膠都得跟他買,誰也不敢卡了。作為追趕者就很難做到這一點,必須是從頭到尾的參與者。
這也是我為什麼疾呼發展第三代人工智慧。
因為第三代人工智慧剛剛開始,我們在同一起跑線上。我們歷史上錯過了好多機會,現在有機會跟全世界在同一起跑線上,如果做好了,做大了,別人就卡不了我們。
另外,現在還有個誤解,認為在深度學習上,我們跟國際在同一起跑線上,我要糾正一下這個想法。
不對的!
在深度學習上我們已經落後人家了。
深度學習從什麼時候開始?1943年開始,發展到今天已經有六七十年歷史,我們跟別人不在一個起跑線上。
甚至現在樂觀到認為深度學習我們領先,不可能的。深度學習在六七十年發展過程中,我數了一下,做出重要貢獻的大概有7-8個國家,沒有一個屬於中國。
在這種情況下,你怎麼可能跟人家在一個起跑線上?
好在第一代第二代人工智慧已經過去了,那只是序幕,我們可以不去管它了。
衝擊AI無人區,比搞兩彈還難
過去錯過的已經錯過了,大部分的追趕任務可以留給企業去完成,科學研究應該在新航道(賽道)上下功夫,勇闖無人區。
我常說研究第三代人工智慧,目標不明確,研究路線也大不清楚,可能比搞兩彈還難,同時這方面我們還缺乏經驗。
兩彈很難,但目標非常明確,已經有人做出來了,是一個追趕的問題。
人工智慧是一個無人區,你根本就不知道怎麼做,全世界都不知道怎麼做,是一項探索任務,所以需要完全不同的體制機制。
我們做追趕任務有很多經驗,因為目標很明確,可以利用舉國體制動員全國力量來完成。
但人工智慧是無人區,目標不明確,路線也不清楚,怎麼組織大家攻關?肯定要建立一個寬鬆的環境,讓大家去自由探索,不可能從上到下做一個統一計劃,第一步幹什麼、第二步幹什麼,那肯定難以成功。
無人區的探索,靠少數專家計劃和具體安排也是不行的。
所以歸根結底,我還是要強調,現在我們有一個非常好的機會,百年不遇,不容錯過。
第一代、第二代人工智慧已經過去了,我們要著眼未來,瞄準第三代人工智慧。
我們該造新燈塔,照亮新航道
任正非把基礎研究比作燈塔,這個比喻很好。他還說我們過去是照著美國人的燈塔去走的,跟著他照亮的路走,現在美國人的燈塔要對中國關閉,怎麼辦?
我想說的是,美國燈塔管它亮不亮,我們都要在新的航道上造個新的燈塔,以照亮新的航道。
第三代人工智慧,就是新的航道(或者賽道),也是新的希望,我們中國人奔向這個新航道,在這個新航道上有可能做出好成績。
第一代第二代的舊航道,我們有些落伍,需要有人去追趕和落地。我們的著力點應該在新的航道上。
科研必須高舉開放和國際化
但也要注意,造新燈塔、照亮新航道,發展第三代人工智慧,不是只供我們自己使用,而是要照亮全世界,引領全世界共同啟航。
美國人越講斷供,我們就越要高舉科學無國界、堅持開放和國際化。他們要把我們剔出去,我們必須反其道而行之。
剛才也說了,解決卡脖子不是樣樣都自己搞、每一項自己都是第一,而應該相互依賴,共同發展,只要有一兩項你是第一,你就有了話語權。
科學研究是全世界的共同事業,人類是命運共同體,川普政府在科技上想與中國脫鉤,既不符合全人類的利益,也違背廣大科技工作者的意願,實際上也行不通。實際上,特蘭普政府的各種動作對科學界的影響並不大。
發展第三代人工智慧必須高舉開放和國際化,必須全世界團結起來,共同發展,以造福全人類。
我常跟年輕學生講,搞研究要避免發明中國人才懂的詞,一個詞你用了,就得考慮英文怎麼寫,國外人看得懂看不懂,不然怎麼跟你一起走?怎麼引領全世界?
不要關起門來搞什麼「中國的科學」,科學只有一種,不存在東方的科學,西方的科學。有東方的文化、西方的文化,但科學全世界就只有一種。所以在科學的基本表達上,就得讓對方看懂。
我們寫的「邁向第三代人工智慧」的文章,已經在《中國科學》上發表了,很多同事和朋友看後,建議我們把這篇文章譯為英文發表,這個建議很好,我們正在做。
第三代AI當前關鍵問題是演算法
發展第三代人工智慧,依靠知識、數據、演算法和算力四個要素,這四個要素是什麼關係?
發展第三代AI依靠的是兩項資源,即知識和數據,通過演算法與算力把這兩個資源利用起來。知識、數據和算力資源我們都還可以。
而關鍵的問題是演算法,因為目前所有原始的AI演算法都是外國人弄的,演算法從哪裡來?從基礎研究中來,因此發展第三代AI首先要抓基礎研究。清華大學人工智慧研究院在演算法研究上取得一些進展,我們發布了「珠算」概率編程庫,這是一個開源演算法平台,其中有我們設計的新演算法。
我反覆強調要抓住這個處於同一起跑線的機會,多做出成績,把生態建立起來,就不怕別人卡脖子,也有了話語權。
之前幾年,大家對深度學習都很樂觀,我講的內容可能不容易被接受,現在慢慢很多人都能接受了。
因為多數人沒有經歷過AI發展的全過程,沒有看到「全貌」,只是看到其中很小的一部分,因此很難看清楚。
我們從1978年就開始從事人工智慧研究,經歷過70年代到80年代的高潮,也體會到90年代的低谷,再到現在的重新高潮,經過40多年的風雨,才逐步搞清楚AI的目標是什麼,我們現在離目標還有多遠等等。
符號主義雖然不成功,但它涉及到人工智慧的核心問題。
深度學習儘管最初受神經科學的啟發,但是後來發展出來的一套演算法,完全是基於概率統計的傳統資訊處理方法,其所以獲得成功,關鍵在於電腦算力的提高。現在大家把深度學習的所有功勞都歸於人工智慧,這其實是錯覺。
大家應該注意到,第三代人工智慧我們是把知識放在第一位,數據放在第二,演算法放在第三位,算力放在最後,這個排序是經過仔細琢磨,不是隨便排的。主要是強調「知識」在發展人工智慧中的重要性。
網路時代數據量指數增長,電腦處理數據的能力遠比人類強,所以將知識處理與數據處理結合起來,可以發揮人類與機器的共同作用。
最後,解決了資源問題,現在要回到利用資源的方法,即需要有好的演算法。目前針對數據的演算法比較多,知識處理的演算法則很少,所以在我們研究院專門成立了一個叫知識智慧的研究中心,就是想通過它加強處理知識的研究。目前在中國研究知識驅動方法的人很少,是我們的短板。以2018年國際人工智慧聯合大會(IJCAI)上發表的主要論文來看,與機器學習有關的論文,中國人發表的論文佔70%左右,而與知識處理有關的論文,幾乎沒有我們的文章。我們建立的通用知識庫也遠比美國少。
基礎科研需要全社會的生態
怎麼解決短板和差距?就得從基礎科研下功夫,不能急功近利,只往好發表論文的方向做文章,難的不好發文章的領域就不去下苦功夫。產生這個現象的一個重要原因就是我們還沒有建立起全社會的生態。
好幾年前我們曾經討論過清華的博士培養要不要學外國一流大學搞高淘汰率?利用高淘汰率迫使學生去做高風險創新性大的課題。你不做這類課題,就不讓你畢業,這樣博士生的水平不就提高了嗎。
我們討論的結果是,中國目前還不具備這個條件。記得我曾舉過我在美國伊利諾伊香檳分校(UIUC)訪問時見過的一個例子。有位博士生做了8年,沒有畢業,高高興興找工作去了,竟然還有很多企業搶著要。我就問企業招聘人員,為什麼搶著給offer?
人家說因為他有8年的工作經驗了,這就是需要的社會生態,社會對「失敗者」的寬容和理解。
設想一下一位清華博士生不能畢業被淘汰了,會是什麼後果?首先他因此不容易找到工作,至少不容易找到「好工作」,不僅他本人有壓力,他的父母甚至爺爺奶奶也不能接受,說明我們中國還沒發展出這樣的社會生態和共識。
我常常說,科學研究是富國的事情、是富人的事情。最早的科學家是什麼人?要麼貴族,要麼神父,吃飽飯沒事幹了,才去搞科學研究,完全是興趣導向的。出不出成果都不影響生活。
窮國或者窮人搞科學研究,避免不了要講效益。
但是實事求是講,我們現在有條件考慮這個問題了,這麼大的國家,支援很少一部分人探索無人區,不急於求成還是值得的。
「餿主意」也比沒主意好
我常常給學生開玩笑說,我不怕餿主意就怕大家沒主意。
因為沒主意就等於0,沒有任何東西。而「餿主意」?如果有些合理成分,那怕0.1合理,自然比「0」主意好。即使「餿主意」不合理,比如是個「負值」,總之有個值,我們可以從中汲取教訓,也比沒主意強。我們現在的問題是,要求大家都要發表「正確」(共識)的好意見,不大允許發表「不正確」(沒有共識)的「餿」意見。
清華目前培養的學生(包括博士生)個個都很優秀,平均水平很高,與國際一流大學,如MIT等學校的水平差不多。差距在於我們的最高水平與國際差距很大,即缺乏出類拔萃的人才。我們教師隊伍也存在類似現象,即平均水平不錯,但缺乏國際級的大師。
科學研究的水平往往取決於它的最高水平,跟木桶效應正好相反。
所以問題就變成了:我們為什麼出不了最高水平?
這個問題往深了講是另一個話題,今天不展開了。
當然這個問題也不能操之過急,跟我們國家的發展階段有關係,需要有個過程,需要我們國家實現全面的現代化。
基礎科研不光要允許失敗,還要經得起失敗
對學生的培養來講,提出問題能力比解決問題能力的培養更加重要。
我們之前人才培養不足的地方是,只重視培養解決問題的能力。
我們培養博士生,主要要求他們獨立提出一個具有挑戰性的問題,然後去解決這個問題,這樣才算完成博士生的培養。問題的挑戰性越大,完成博士論文的水平越可能高,但風險也越大。目前大多數學生都願意做風險低的課題,當然完成的論文品質就不會很高
產生這個現象主要原因是,擔心一旦失敗了後果很嚴重,就再也爬不起來了。
換句話講,我們還沒有建立起一個「經得起失敗」的完善科研生態系統,讓「失敗者」在失敗之後還能夠有重新爬起來繼續前進的機會,有了這種生態,才會有更多的人去闖無人區,參與風險和困難很大的問題的探索。