張鈸院士:人工智慧的魅力就是它永遠在路上 | CCAI 2019

  • 2019 年 10 月 7 日
  • 筆記

作者 | 楊曉凡 編輯 | 唐里

2019年9月21日,2019第五屆中國人工智慧大會(CCAI 2019)在山東省青島市舉行。大會為期兩天,包括中國人工智慧學會理事長、中國工程院院士李德毅,清華大學人工智慧研究院院長、中國科學院院士張鈸,卡內基梅隆大學電腦學院副院長、蘇格蘭皇家學院院士賈斯汀·卡塞爾,加拿大滑鐵盧大學教授、國際計算學習理論學會前主席賽·本·大衛,騰訊人工智慧實驗室主任張正友,中國人工智慧學會秘書長王衛寧等多位重磅學術嘉賓出席,還有一百多位國際人工智慧領域頂尖人才,一千多位中國外人工智慧領域專家教授、頭部企業高層參會。這也是青島市「建設現代化國際大都市,打造對外開放新高地」戰略下的重要活動,青島期待打造人工智慧的國際合作新平台,整合全球的要素資源,加快推進人工智慧的發展。

山東省委常委、青島市委書記王清憲在開幕致辭中說道,本屆大會的主題是「智變融合」,人工智慧最大的價值在於賦能,與場景的應用結合起來,與產業融合起來,從而帶來點石成金的變化。人工智慧為百業賦能的過程,將會形成巨大的產業;「人工智慧科技服務產業」,就是利用人工智慧的發展成果,推動更廣泛的產業應用,實現人工智慧為百業賦能的價值。

清華大學人工智慧研究院院長、中國科學院院士張鈸上午進行演講,題目是「邁向第三代人工智慧的新征程」。AI 科技評論根據現場速記把演講內容整理如下。

張鈸:各位領導、各位專家、各位來賓,我今天講的題目是「邁向第三代人工智慧的新征程」。這個題目是我經過認真考慮的,特別加了「新征程」。我一直向大家傳達一個資訊,人工智慧遇到新的機遇,如果我們有可能突破現在面臨的問題,人工智慧就會長足往前發展。

人工智慧有個特點,我今天在報告裡面主要傳達這麼個特點:大家不能指望人工智慧一出來就畢其功於一役。它永遠在路上,這就是人工智慧的魅力所在。

我們看一下人工智慧究竟做了什麼事兒?第一件事就是第一代人工智慧提出的符號模型,以知識經驗為基礎的推理模型,這是人工智慧的第一個重大突破。這個突破後來產生了一個結果,就是這個理論提出時有個非常樂觀的估計,1956年由西蒙提出,基於這種模型,十年之後機器可以打敗所有棋手,二十年以後機器取代人類所有的工作。實際並不是這樣,六十年以後機器才打敗棋手,機器究竟代替人類的所有工作是什麼時間,可能還很遙遠,這也是人工智慧的另外一個特點,往往被高估。

人工智慧的第一代模型,有優點,但是也有很大局限性。這個優點是顯然的,因為它是模仿人類的,它可解釋,魯棒性很強,但是它的局限性也非常大。因為最大的問題是人類的知識經驗,很難準確表達,這就是產生的後來人工智慧冬天的根本原因。當時的應用很有限,幾乎沒有推廣,但是,有了大數據以後,這個問題得到了很大改善,特別是機器的能力提高以後,可以把大量的數據作為知識放在機器里,這就是最典型的沃森系統。

沃森系統可以做癌症的免疫治療,這裡面用多少知識呢?100萬個醫學雜誌中抽取的2500個摘要,400萬病人的數據,再加上1861年以前所有藥物的專利,它有醫學知識,並聯的數據再加上藥物知識,就可以做癌症的免疫治療。當然了,很多慢性病的治療和管理,這個系統也做得很好,中國的中國也有大量這方面的工作在探索和研究。

第二代人工智慧,一個最重要的成果就是深度學習。也就是說,第一代人工智慧提出來,如果能夠很好地利用人類的知識,就可以建立很好的人工智慧系統,如果我們有充分數據,也有可能建立起有用的人工智慧的系統。

深度學習為什麼這麼受重視?一個很重要的原因,它有兩個重大變化。當網路層次增加以後,有兩個重大變化:第一個變化,輸入只要原始數據,不需要預處理。第二個是性能提高很多,這就造成了深度學習的重大突破。也就是說,它從一定意義上有通用工具,對領域的知識要求不高,同時能夠處理大數據。

這就帶來很大的變化,大家也看到了,語音識別,2001年時它的識別率停留在80%,也就是20%的誤識別率;2016年誤識率就降到了5.9%,達到專業速記員的水平,到了2017年,所有產品包括Google、微軟,包括中國的訊飛、百度,用的全是深度學習。

變化更大的是影像識別。有一個標準的影像識別數據集 ImageNet,大家知道,2011年,它的誤識率是50%,有一半認錯了。但是四年以後,2015年就超過了人類水平,原因也是利用了深度學習。

最後一個,給大家印象最深就是AlphaGo,大家都知道了。因此就有很多估計,十年之內代替40%以上人類的工作,三五年裡面,智慧駕駛車就可以量產,等等,剛剛李院士說到了這個問題,他分析得很深刻。實際三五年裡面不可能量產。

技術已經完全成熟,我們現在的研究已不成熟,主要是應用問題。為什麼在人工智慧上往往產生樂觀估計?主要原因有兩個:一個是對發展人工智慧的困難性估計不足,對取得的成果估計過高。一個估計不足,一個估計過高,就產生了問題。另外一個很重要的原因,受歷史事件的影響。過去我們發現,有了蒸汽機以後就產生了工業革命,有了電動機發動機以後就產生了電氣革命,有了電腦以後產生了資訊革命,大家很希望有一個東西出來以後引起人工智慧的革命。

現在的問題是,有沒有?至今為止,還沒有發現人工智慧裡面的蒸汽機和電腦。曾經最開始寄希望於符號模型,結果發現符號模型也沒有那麼管用。第二次發現的是大數據+深度學習,以為大數據+深度學習就是人工智慧的蒸汽機和電腦,為什麼這樣?

這不能不考慮到人工智慧的特點,我們說深度學習根本不是AI的通用機。現在大家在尋找通用的人工智慧,到底有沒有,還有爭論,不去管它,但至少深度學習不是人工智慧。這個非常明顯,第一代人工智慧也好,第二代人工智慧也好,它的應用場景必須滿足以下五個條件。

從正面來講,所有的應用場景,如果滿足以下五個條件,電腦絕對能夠戰勝人類,不管這個問題多麼複雜:具有豐富的數據或知識,完全資訊,確定性資訊,靜態,單領域和單任務。

最明顯的例子是圍棋,圍棋多麼複雜,但是圍棋滿足這五個條件,所以電腦戰勝在圍棋上戰勝人類是早晚的事情。所以從正面來講,如果你滿足這五個條件,不管多複雜,電腦絕對戰勝人類。長遠來看,如果你的應用場景不完全滿足這五個條件,其中有些條件不滿足,你這個工作就變成困難。自動駕駛為什麼如此困難?根本的原因在這裡。為什麼我們難以做出來廉價、可靠的自動駕駛呢?背後的原因就在這裡,因為自動駕駛很多條件都不滿足,它不是完全資訊,它不是確定性資訊,它不是靜態的環境,或者是按照確定性規律演化的,它的很多東西是不可預測的,它也不是單領域的,裡面有人駕駛的車、行人、其它車輛。所以剛剛李院士提出來專用道,就是把這些東西弄乾凈,變成單領域。所以我們一直說,如果有些條件是不符合這五條,你就需要下功夫。

現在人工智慧能夠在這些領域裡面得到應用,換句話說,這些領域裡面有很多應用產品符合剛才講的五個條件。如果這些領域裡面的應用場景符合五個條件,大家大膽去做,絕對會超過人。根據現在電腦強大的力量,是可以做到這一點的。但是,這些應用裡面,也有大量不符合那五個條件的,大家必須下功夫,不能指望靠現在的第一代、第二代人工智慧去解決它。

舉個簡單的例子,複合場景下的決策,完全資訊條件下的決策或者完全資訊下的博弈,電腦戰勝人類是絕對的。下面一個問題,不完全資訊的博弈及打牌,大家都知道,今年5月份對撲克牌這個問題也解決了。換句話說,6人無限注的德州撲克,電腦能戰勝人類,這就意味著概率意義下的不確定性,機器也可以戰勝人類。但是人類的決策環境都不符合前面兩個條件。所以在複合環境下的博弈或者複雜環境下的決策,機器跟人類還差得比較遠。從這裡來講,應用場景是極為重要的。

第二個,我們必須要重視的,用數據驅動的方法做出來的系統,有大量毛病,或者說這些毛病是根本性的,是極為危險的。這裡面列出來的,簡單舉個例子,一個影像識別系統,都可以說它的識別率超過人類,但是這個圖象識別系統跟人類的感知完全不同。

就是這樣的系統,你給它雜訊,它可以識別為知更鳥。你給它一個雜訊,它可以識別為獵豹。換句話說,模式識別系統並沒有達到人類認知的水平,只達到低等動物的水平,所以感知這個詞翻譯得非常好,感覺+知覺,低等動物只有感覺,沒有認知。所以機器現在達到的水平是低等動物的水平,它可以分辨不同的物體,但是它本質上不認識這個物體。另外是它非常脆弱,非常容易受攻擊。

這是阿爾卑斯山圖片,人起來是,機器看起來也是,只要給它加上雜訊,右邊這個圖和左邊那個圖,唯一的區別是雜訊多一點,人看起來還是阿爾卑斯山,機器看起來是一條購,而且它的置信度是99.99%,它99.99%認為這是一條狗,非常容易受欺騙,這就說明機器跟人的認知差異非常大。

語音也是同樣的道理,前面的英文說的是一句話,我們加上一點點雜訊,人聽起來還是一樣的,機器聽起來就是另外的內容,這就非常危險。

搞軍事的人說,過去你語音傳過去,它進行干擾,你聽不見而已。現在語音傳過去,它說進攻,可以讓你聽成退卻,加一點雜訊就行了,這就是AI的安全性。

另外,缺少自我知識,這是非常重要的。你說我用這個話,讓它翻譯,「說你行的人行」,這句話電腦怎麼翻呢?「說你專業的人行道」,瞎翻,為什麼瞎翻?它不知道自己不知道,沒有任何自知之明。這是很危險的。為什麼翻譯成人行道呢?「人行」,它以為是人行道。為什麼翻譯成「你的專業」呢?「你行」。這是非常危險的。大家想想,我帶了一個翻譯,翻譯水平挺高的,大多數翻譯是很準確的,但是他會瞎說,你敢用嗎?人類不會,因為他知道這句話如果沒有聽明白會再問是什麼意思,電腦沒有自知之明,人貴有自知之明,這是人類智慧的一個部分。怎麼讓機器有自知之明?這是很困難的事。

下一步,我們現在有個新的歷史機遇,就是邁向第三代人工智慧。第三代人工智慧就要糾正前面說的兩個局限性,建立可解釋、魯棒的人工智慧理論,發展安全、可信、可用的人工智慧技術,促進人工智慧的創新應用。

我們成立人工智慧研究院就是想擔負這個責任,用什麼辦法解決這個問題?就通過一個核心和兩個融合:一個核心是加強基礎研究,必須從理論上去突破。我們剛才講了,深度學習,所以有這麼多毛病,這個原因是它的原理開始的,它的原理就不對,不是用人類一樣的原理。所以我們必須更好地去解決它,才有可能往前邁進。用的方法主要是兩條:一個是多學科交叉,必須多學科交叉,跟心理學、神經科學。大家知道,第一個模型是心理學家提出來的,第二個模型是神經科學家和數學家提出來的,都不是電腦的人提出來的,必須要加強學科交叉,應用結合。

我們一共成立了十個研究中心,包括全校的18個系和學院,利用各種學科,不光是電腦的,不光是資訊領域的,也有心理學的、法律的、文學的,都參與進來。

除了技術上的研究以外,目前人工智慧的技術與治理也是重大的問題,現在清華大學也參與了這個工作,必須在國際上要有我們的話語權,要在這個問題上發出中國的聲音。做的辦法有兩條:一條是新原理和新模型,就是跟其它學科交叉,我們都在做。還有腦科學啟發的,還有神經科學的。把數據驅動和知識驅動結合起來,也是重點做的內容,我們已經有不少成果。大家看展覽,我們用的珠算平台開了一個公司,就是應用新的演算法,比Google演算法又進了一步,帶了第三代演算法的特色。第一輪投資,對我們平台的估值是7億人民幣。這個平台跟國際已有的其它平台相比,還是有很多優勢的。我們也在知識表示、知識推理上做了很多工作,還有小樣本、因果推理。常識,剛才李院士也提到常識推理。

最後做一下總結,人工智慧的確是本世紀最重要的發展領域之一,它的發展將會對人類產生重大影響。但是我們一直強調,人工智慧不像以前遇過的科學,以為某一個定理解決了,所有問題就迎刃而解。人工智慧太複雜了,我們要不斷往前推進,才能使人工智慧進一步發展。

(完)