圖靈的文章「Computing machinery and intelligence」譯文

  • 2019 年 10 月 5 日
  • 筆記

圖靈奠基AI的力作「Computing machinery and intelligence」全文譯完,摘自http://blog.sciencenet.cn/blog-2322490-1122667.html,如有侵權及時聯繫我,我會第一時間刪除。

電腦器與智慧

目錄

1,模仿遊戲

2,對新問題的評價

3,遊戲中的機器

4,數字電腦

5,數字電腦的通用性

6,主要問題的對立觀點

7,學習機器

1,模仿遊戲

我建議考慮這樣一個問題:「機器能思考嗎?」要回答這個問題,需先給出術語「機器」和「思維」的定義。雖然可以用儘可能反映其普通用法的方式給出定義,但是這種方式是危險的,因為很難擺脫像用蓋勒普調查那樣的統計方式得出「機器能思考嗎?」的結論及意義,顯然這是荒謬的。因此,我不是試圖給出這樣的定義,而是提出另外一個問題,這個問題和原問題緊密相關,而且是用相對不含糊的詞語表達的。

這個新的問題可以通過一個遊戲來描述,稱之為「模仿遊戲」。需要三個人來玩,一個男人(A),一個女人(B)和一個男女皆可的提問者(C)。提問者呆在一個與另外兩人相隔離的屋子裡,遊戲的目標是提問者要判斷出外面哪個是男人,哪個是女人。提問者用標籤X,Y指稱外面的兩個人,遊戲結束時,他要說出「X是A,Y是B」或者「X是B,Y是A」。提問者C允許向A和B提出下面這樣的問題:

C:X,請告訴我你頭髮的長度。

現在假如X實際上是A,那麼A必須回答。A在遊戲中的目標是努力使C做出錯誤的判斷,他的回答可以是:  

我的頭髮烏黑髮亮,最長的一縷大概九英寸長。 

為了排除聲音幫助提問者得出結論,問題的答案應該寫出來,最好是打出來。理想的安排是,讓兩個屋子用遠程列印通訊,也可以通過中間人傳遞答案。而B在這個遊戲中的任務是努力幫助提問者,她的最優策略可能就是給出正確答案。她可以在她的答案中加入「我是女的,別聽他的」這樣的話,但是這並不能提供更多的幫助,因為男人A同樣也能做出相似的評論。

現在提出這樣一個問題,「如果用機器代替A,將會發生什麼情況?」同與兩個人玩這個遊戲相比,提問者判斷錯誤的幾率是否發生變化?這個問題取代了原問題「機器能思考嗎? 」

2,對新問題的評價 

除了問:「新問題的答案是什麼?」還會問:「這個新問題有研究的價值嗎?」我們先考察第二個問題,避免進入無限循環。

新問題的優勢在於,把一個人的體力和智力完全區分開了。沒有任何工程師或化學家宣稱能夠生產出和人的皮膚完全相同的物質。在未來的某天,這可能成為現實,但是讓一個「思維機器」具有如人一般的皮膚對於讓它更像人並沒有多大的幫助。我們設置問題的方式考慮到了防止讓提問者看到、接觸到或聽到其他的遊戲者。所提議的標準的其它優勢在下面的樣板問題和回答中顯示出來:

問:請寫一首以Forth Brige (譯註:1890建成於英國,開現代橋樑建造的先河)為主題的詩。  

答:我無能為力,我從來不會寫詩。  

問:34957加70764等於多少?  

答:(停了三十秒鐘後給出答案) 105621。  

問:你玩象棋么?  

答:是的。  

問:我的王在K1,沒有別的棋子了,你只有王在K6,車在R1。該你走,你走哪步?  

答:(十五秒鐘的停頓後)車移動到R8,將軍。

這種問答方式似乎適用於我們希望考察人類能力的任何領域。我們不希望因機器不能在選美比賽中取勝而被懲罰,正如我們不希望因人不能在和飛機賽跑中取勝而被懲罰一樣,我們的遊戲設定讓這些無能變得無關緊要,只要參與者認為合適,他們可以吹噓他們的魅力,力量或勇敢,而提問者不能要求他們做實際的展示。

這個遊戲可能會被批評:機器在遊戲的成敗中佔有過多的比重,如果一個人試圖裝成機器,他的表演顯然非常糟糕,他會因為算術上的緩慢和不準確立即出局;機器可能不會做那些被認為是思考的事,與人的方式相差甚遠?這個反對意見確實很棘手,但是,儘管如此,我們至少可以說,如果機器被設計得可以令人滿意玩這個模仿遊戲,那我們不必擔心此異議。

有人可能會建議,在玩「模仿遊戲」時機器的最佳策略不是模仿人的行為,這是可能的,但我認為這種做法不可能有什麼大的影響。在任何情況下,這裡都不打算研究遊戲理論,並且假定最優策略是努力提供和人一樣的答案。 

3,遊戲中的機器

只有當「機器」這個詞的意義確定下來後,在§1中提出的問題才能明確下來。自然,我們希望允許一切技術都使用在我們的機器上;我們也希望接受這種可能:一個或一隊工程師製造出一個可以工作的機器,但是卻不能很好的描述其工作方式,因為他們使用了基於試驗的方法來設計它;最後,我們希望從機器中排除以通常方式出生的人。要讓定義同時滿足這三個要求是困難的,例如,你可能會要求這些工程師都是同一性別,但這實際上也是無法滿足的,因為通過個人的一個皮膚細胞產生一個完整的個體不是完全不可能的,這將是生物科技具有劃時代意義的突破,但我們不會認為這是「建造思維機器」的案例。這就要求我們放棄允許一切的技術的打算,我們更願意這樣,因為目前「思維機器」的研究熱點集中在一種特殊的通常被稱為「電子電腦」或「數字電腦」的機器上,因此,我們僅僅允許「數字電腦」參加我們的遊戲。 

此限制第一眼看上去過於嚴格,我會試圖說明事實並非如此。要做到這一點,必須簡要說明這些電腦的性質。

人們可能會說:將機器限定在數字電腦,按我們的「思考」標準,如果機器(不能如我所願)會令人失望,得出結論機器在遊戲中不能表現出色。

目前已經有許多數字電腦在工作,人們可能要問:「為什麼不拿一台直接作實驗?很容易就能滿足遊戲的要求。讓許多提問者同時參加遊戲,然後統計出判斷正確的概率」。對這個問題的簡要回答是:我們並不是要問是不是所有的數字電腦都能在遊戲中表現良好,也不是要問現在的電腦中有沒有能夠通過實驗的,而是要問:是否存在可想像的電腦能夠通過遊戲。這僅僅是一個簡要回答,我們稍後將以不同的眼光看待這個問題。

4,數字電腦

數字電腦背後的思想可以解釋成,旨在執行任何可以通過人計算而完成的操作。一個計算員應該嚴格遵守規則,沒有一點偏離規則的權力。我們可以假設這些規則寫在一本書上,每次被分配新的任務時,將會改變執行步驟。他有無限的紙進行計算,也可以用「台式機器」進行乘法和加法運算,但這並不重要。

如果使用上述解釋定義數字電腦,可能陷入循環論證,為此我們通過概述預期達到的效果來避免。一個數字電腦通常由一下三個部分組成:

(i)存貯器(ii)執行單元(iii)控制器 

存儲器用來存貯資訊,對應於計算員的紙,既在紙上計算,也在紙上記錄計算規則。至於說計算員進行心算,那麼一部分存儲器將對應於他的記憶。

執行單元是一次計算中各種操作進行的地方,這些操作隨著機器而變化。通常相當長的操作可能是:「3540675445乘以7076345687」,但是一些機器可能只執行「寫下0」一類的簡單操作。 

上面曾經提到計算員的「規則書」由機器中的一部分存儲器代替,不妨把它們稱為「指令表」。控制器的功能就是保證指令按照正確的順序執行,其設計使得這成為可能。 

存儲器中的資訊通常被分解成大小適中的數據塊,例如,在一個機器中,一個數據塊由十個十進位數組成,數據以某種系統方式被分配到存儲單元中。一個典型的指令可以是:

「把存放在6890的數加上存放在4302的數,並把結果存入後面單元。」顯然,此指令不會用英語表達,更有可能編碼成6809430217這樣的形式,這裡,17表示對這兩個數進行哪個操作,在此就是「加法操作。。。」 請注意,指令共佔用了10個數字,因此正好是一個數據塊,非常方便。控制器保證指令按照它們的存儲順序被執行,但是偶爾會碰到這樣的指令:

「現在執行存儲在 5606的指令,並從那裡繼續執行。」或者是:「如果 4505位置是0,那麼執行存儲在6707的指令,否則繼續」。 

後面這種指令非常重要,因為它能重複執行一段指令直到滿足某種條件,但不是通過每次改變指令來做的,而是一遍又一遍執行相同的指令。可以類比家庭生活:如果媽媽想讓湯姆每天上學時都到修鞋匠那裡看看她的鞋是不是修好了,媽媽可以每天都告訴他一遍;另一種方式是,在一個湯姆每天上學都能看到的地方貼個便條,告訴他到鞋匠那裡去看一下,當湯姆拿回鞋時,就撕掉那個便條。 

讀者必須接受數字電腦可以而且事實上就是按照我們所提出的原則建造的,幾乎完全能夠模仿一個計算員的行為。

當然,上面描述的計算員所使用的規則書僅僅是一個方便設想,實際中計算員記住他要做什麼。如果一個人想讓機器模仿計算員執行複雜的操作,他必須告訴電腦如何做,並把結果翻譯成某種形式的指令表。這種構造指令表的行為通常被稱為」編程」,「給一個機器編程使之執行操作 A」,意味著把合適的指令表放入機器以使它能夠執行A。

數字電腦的一個有趣變化是「帶有隨機元素的數字電腦」,它們有特定的指令進行擲色子或者別的等價電子過程,例如一個指令可能是「擲色子並把結果存入 1000。」有時這樣的機器被描述為具有自由意志(儘管我自己並不使用這種表達)。通常並不能通過觀察判斷出一個機器是否有隨機元素,因為一個相似的效果可以依據Pi的小數部分進行選擇來產生。

大多數現實中的數字電腦僅有有限的存儲空間,讓一個電腦具有無限的存儲空間並不存在理論上的困難,當然在任何時候都只有有限的部分被使用。同樣,只有有限的存儲空間被建造,不過我們可以想像越來越多的存儲空間可以根據要求添加。這樣的電腦具有特殊的理論價值,將被稱為無限容量電腦。

有關數字電腦的設想很早就產生了。1828至1839年擔任劍橋大學的Lucasian數學教授的Charles Babbage(查爾斯.巴貝奇)設想了這樣的機器,並稱之為分析機,但是並沒有實現。儘管 Babbage有了所有的關鍵思想,他的機器在那個時代卻沒有吸引人的前景,它能夠達到的運算速度肯定比一個計算員要快,但僅相當於曼徹斯特機的百分之一,而曼徹斯特機也是現代電腦中相當慢的一個,分析機的存儲全部由用輪子和卡片組成的機械實現。

事實上,全部由機械實現的Babbage分析機幫助我們破除了一個迷信。現代數字電腦是電子的,神經系統也是電子的,這一事實常常被過份強調了。既然Babbage的機器沒有使用電,而所有的數字電腦在某種意義上都是等價的,那麼我們就會明白是否使用電在理論上並不重要。當然,通常高速運算需要電,因此,我們就會發現在這些地方使用電是理所當然的。在神經系統中,化學過程至少和電過程同樣重要,某些電腦的存儲器主要基於聲學原理,電腦和神經系統都使用電僅僅是表面的相似,如果我們希望尋找這樣的相似,倒不如尋找功能上的數學相似性。

5,數字電腦的通用性 

上章考慮的數字電腦可以被歸類為「離散狀態機」,這類機器可以從一個確定狀態向另一個狀態突然跳變。為了不會有混淆這些狀態的可能,它們之間要有足夠的差別。嚴格的說,這樣的機器是不存在的,一切事件實際上都是連續變化的,但是有許多種機器能夠被看作離散狀態機器。例如在照明系統中的開關,我們可以把開關看成只有開和關兩個狀態,它們之間肯定有中間狀態,但是在絕大多數情況下可以忽略它們。作為離散狀態機器的例子,我們可以考慮一個每秒轉120度的輪子,這個輪子可能因一個槓桿的阻擋而停下來,在輪子上有一個發光的燈。這個機器可以被抽象的描述為下面的形式,機器的內部狀態 (通過輪子的位置來描述(可以是q1,q2和q3,輸入訊號是i0或i1(槓桿的位置)。任何時候的內部狀態可以根據上一次狀態和輸入訊號由下表描述:

輸出訊號可以用下表描述,它是唯一能夠被外部觀測的內部狀態指示器。

這個例子是一個典型的離散狀態機,只要它們的狀態是有限的,就可以用這樣的表格描述。 

可以看出,只要給出初始狀態和輸入訊號,所有的未來狀態都是可以預測的,這讓我們想起了拉格朗日的觀點,那就是,只要給出宇宙中任意時刻所有粒子的位置和速度,就能夠預知未來的所有狀態。我們考慮的預測和拉格朗日相比較更接近於實用性。「宇宙作為整體」的系統,只要初始條件的一個很小的誤差,就會引起系統以後顛覆性的效應,某個時刻一個電子位置的億萬分之一厘米的偏移,將決定一個人會在雪崩中死去還是逃生。我們稱之為「離散狀態機」的機械系統的一個基本特性是,這樣的現象不會發生。即使是考慮實際的物理機器而不是理想機器,只要知道了某個時刻狀態的合理準確的資訊,就可以相當準確的預測未來狀態的資訊。

正如我們所提到的,數字電腦屬於離散狀態機,但是這樣的機器所能夠達到的狀態通常是相當大的,例如,現在在曼徹斯特工作的機器可以有2^165000個狀態,也就是大約10^50000。而上面描述的輪子,僅有三個狀態。找到有如此多狀態的原因並不困難,電腦具有一個存儲器,對應於計算員的紙,這些存儲器中應該能夠寫入任何能夠寫入計算員所用紙上的符號。為了簡單起見,假設僅僅用從0到9的數字作為符號,忽略手寫體的差別。假如電腦具有100張每張50行,每行30個數字的存儲空間,那麼狀態的數目就會是10^(100*50*30),即10^150000,這大約是三個曼徹斯特機狀態的總和。狀態數的基數為2的對數通常被稱為機器的「存儲大小」,因此曼徹斯特機的存儲大小是165000,而上面例子中輪子的存儲大小是1.6。如果兩個機器加在一起,他們的存儲大小應該是原來存儲大小的和。因此我們可以說「曼徹斯特機具有64個磁帶存儲器每個存儲器的大小是2560,還有8個電子管,每個容量為1280。各種各樣存儲器加在一起大約是300個,總共174380。」 

只要給出對應於離散狀態機器的表格,就能夠預測出機器將會做什麼。沒有理由這樣的計算不能通過數字電腦來完成,只要運行足夠快,數字電腦就能夠模擬任何離散狀態機的行為。這樣,模仿遊戲就變成在當前機器(B)和數字電腦(A)之間進行,而提問者就不能區分它們。當然,數字電腦除了運行足夠快,還必須有足夠的存儲空間,而且模仿不同的機器之前必須被重新編程。

數字電腦可以模擬任意離散狀態機器的性質被表述為「通用機器」,具有這樣性質的機器帶來一個重要結果就是,若不考慮速度,並不需要設計出不同的新機器來執行不同的計算,它們都可以用一個數字電腦來實現,只要根據情況適當編程。由此可見,所有數字電腦在某種意義上是等價的。

我們現在可以重新考慮在第三章末尾提出的問題,暫時把問題「機器能思考嗎?」用「是否存在在模仿遊戲中表現出色的可想像的數字電腦?」代替,如果願意,我們還可以問「是否存在表現出色的離散狀態機?」,但是從通用性的角度,我們可以看出這兩個問題都等價於「讓我們把注意力集中在一個數字電腦C上,如果我們可以讓其具有足夠大的存儲空間,足夠快的計算速度,而且對它進行適當的編程。C扮演角色A,人扮演角色B,C能不能在模仿遊戲中表現出色?」

6,關於主要問題的對立觀點

現在我們可以認為基礎清理好了,準備就「機器能思考嗎?」及上一章結尾的引申問題展開辯論了。我們並不能完全放棄問題的原始形式,因為對所替代的問題的合理性會有不同的意見,我們至少應該聽取這方面的意見 

如果我先解釋自己的信念,會讓讀者覺得簡單些。首先讓我們來看看這個問題更確切的形式,我相信,大約50年後電腦的存儲量可達到10^9左右,使得在模仿遊戲中會表現更好,這樣以來一般提問者在提問5分鐘後,能準確判斷的概率不會超過70%。我認為,原來那個「機器能思考嗎?」的問題就沒有什麼意義,不值得討論了。儘管如此,我認為本世紀末,由於語言和一般受教育觀點會改變,那時候人們又能重新談論機器思維而不感抵觸。我還認為,掩蓋這些信念不會有益處,人們普遍認為,科學家進行科學研究工作總是從可靠的事實到可靠的事實,從來不受任何未經證明的猜想所影響,這種看法實際上是錯誤的,只要能清楚地劃分哪些是經過證明的事實,哪些是猜想,就不會有害處。猜想往往是非常重要的,因為它們提示有用的研究線索。 

現在我來考慮與我的看法相對立的觀點。 

(1)來自神學的異議

思維是人類不朽靈魂的一個功能,上帝賦予每個男人和女人一顆不朽的靈魂,但從未將它賦予任何其他的動物或機器。因此,動物或者機器不能思考。 

儘管我不能接受這種觀點,但我試圖用神學的語言來回復。如果將動物和人劃為一個類別,我認為這個觀點更有說服力,因為在我看來,生物與非生物之間的差別遠遠要比人和其他動物之間的差別大得多。如果站在其他宗教團體成員的立場看,這種正統觀點的武斷性會更明顯。伊斯蘭教認為婦女沒有靈魂,基督教對此有何感想?但是,現在暫不管這一點,讓我們回到問題的焦點上來。在我看來,上面所引的論點對上帝威力的萬能性有很大的限制。承認上帝對有些事情也是無能為力,比如,他不能讓1等於2,但是難道我們不應該相信,如果上帝覺得合適,他完全可以賦予一頭大象以靈魂嗎?我們可以期望上帝通過自己的威力產生變異,讓大象有了一個較發達的大腦,用來滿足靈魂的需求。形式相似的論點也可以用在機器上,這可能看起來不同,因為更難以「下咽」,但這只是說明上帝認為這些環境賦予靈魂不太合適,有關情況我們將在本文的其餘部分討論。在企圖製造這樣的機器時,我們不應該無禮地篡奪上帝創造靈魂的權力,就像不應該剝奪我們生兒育女的權力那樣。在兩種情況下,我們其實都是上帝意志的工具,為他所創造的靈魂提供住所。 

然而,這只是猜測,不管用什麼神學的論據來證明,我仍不以為然。過去已經證明這樣的論據漏洞百出,在伽利略時代,有人提出,「太陽一動不動地懸著……整天都不慌不忙,不想落下」(《約書亞書》,10。13)以及「他為大地奠定基礎,使它不隨時間移動」(《詩篇》,105。5)這些經文正好用來駁斥哥白尼的理論。從我們今天的知識來看,這種論據是徒勞的。當這些知識不再適合時,情況便大不一樣了。

(2)「鴕鳥」式的異議

「機器思維後果太令人恐懼了,但願機器不會思維。」這種觀點不如上面的說法那樣直言不諱,但對我們許多人有影響。我們都傾向於認為人類以某種微妙的方式比其他生物優越,要是能證明人一定是高一等的,那再好不過了,因為那樣一來,就沒有失去高居一切之上的地位的危險。神學論點的流行明顯與這種情緒密切有關。這種看法在知識分子中會更強烈,因為他們比其他人更看重思維的力量,更傾向於相信人類在這方面能力上的優越性。

我認為這個論點不足以反駁,安慰會更合適:也許這應該在靈魂輪迴說中尋找。

(3)來自數學的異議

數理邏輯中的一些結果可以用來指出離散狀態機器能力的局限,其中最著名的就是哥德爾定理,此定理聲稱,在任何充分的邏輯系統中都能形成陳述,在本系統中既不能被證真,也不能被證偽,除非這個系統本身就是不一致的,丘奇、克利、羅瑟和圖靈等人也得到了相似的結果。圖靈的結果最容易理解,因為直接涉及機器,而其他人的結果相對來說是間接的:比方說,如果使用哥德爾定理,我們還需要某些附加手段,通過機器來描述邏輯系統,而描述機器又需要通過邏輯系統。此結果涉及一種機器,實質上是一台通用數字電腦,即使是這樣一台機器,對有些事情也是無能為力的。如果電腦被設計成能在模擬遊戲中回答問題的話,對有些問題要麼給出錯誤的答案,要麼答不上來,不管給它多長時間。當然,存在著許多這樣的問題,但是也存在著儘管這台機器回答不了,但另一台機器卻能給予滿意回答的問題。我們現在假定,只要回答「Yes」或「No」,而不是「你認為畢加索怎麼樣?」這類問題。我們知道機器必定無法回答的問題是下述這類問題:「考慮有以下特點的機器。。。這台機器會不會對任何問題作出『Yes』的回答?」這裡省略的是如§5中對某台標準形式機器的描述。如果所描述的機器與那台被提問的機器具有某些相對簡單的聯繫,那麼,我們就能知道,答案不是錯了,就是沒有答案。這就是數學的結論:此結論認定機器能力有限,而人類智慧則沒有這種局限性。

對這個論點的簡短答覆是,儘管已經確定任何特定機器的能力都存在限制,但人的智慧不受限制,僅僅被陳述,並沒有任何證明。我認為這個論點不能就這麼輕易駁回,每當一台這樣的機器被問及適當的關鍵問題,並給出確定的答案,而我們知道此答案一定是錯的,我們無疑會產生一種優越感,這種感覺是錯覺嗎?毫無疑問,這是真實的,但我認為不應該過分重視它。我們自己經常會回答錯一些問題,卻會對機器的錯誤而沾沾自喜。而且,我們的優越感來自對付一台機器,但我們無法同時對付所有的機器而且不出差錯。總而言之,人可能比任何特定的機器聰明,但是可能有更聰明的其他機器,等等。

我認為,堅持數學論證的人大多願意接受模仿遊戲作為討論的基礎,那些相信前兩個反對意見的人可能對任何標準都不感興趣。

(4)來自意識的論點

這個論點在Jefferson教授於1949年的Lister演說中有很好的表達,我引用他的一段話:「若要我們承認機器等同於大腦,除非機器能夠因為感受到思想與情緒,而不是偶然碰到符號塗寫十四行詩或協奏曲。也就是說,它不僅寫了,而且知道自己寫了。任何機器都感覺不到(不只是人工訊號,一個簡單的圖謀)成功的喜悅,保險絲跳閘的沮喪,被奉承而沾沾自喜,因犯錯誤的痛苦,被X愛所迷惑,也不會因慾望得不到滿足而生氣或沮喪。」

這個論點看上去否定了我們測試的有效性。按照這種觀點的最極端形式,一個人確信機器思維的唯一途徑就是成為那台機器,自己去感受思維活動,然後向世人描述這種感受,但是當然不會有人被證實。同樣,依照此觀點,要想知道某人是否在思維,唯一的途徑就是成為那個人,這實際是唯我論的觀點,這也許是所持的最有邏輯的觀點,但若真是這樣,那思想交流就太困難了,A相信「A在思考,而B不在思考」,而B相信「B在思考,而A不在思考。」與其為此爭執不休,不如客氣認為大家都在思考。

我肯定Jefferson教授並不希望採納極端和唯我論的觀點,他也許願意接受模擬遊戲作為一個測試。模擬遊戲(省略了遊戲者B)在實際中經常採用「口試」的方式來發現某人是真的理解某事,還是「鸚鵡學舌」。讓我們聽聽這種「口試」的一部分:

詢問者:你的十四行詩的第一行,「我欲比君為夏日?」若將「夏日」改成「春日」,是否更好?

見證人:這樣就不押韻了。

詢問者:改為「冬日」呢?這樣會押韻。

見證人:可以,但是沒有人願意被比作冬日。

詢問者:你說Pickwick先生讓你想到聖誕節了?

見證人:某種程度上。

詢問者:然而聖誕節是冬天的一天,我認為Pickwick先生不會在意這個比喻。

見證人:我認為你在開玩笑,冬日是指一個典型的冬日,而不像聖誕節那樣特殊的一天。

不再贅述。如果那台寫十四行詩的機器在「口試」中能夠這樣對答,Jefferson教授會作何感想呢?我不知道他會不會把機器的那些答覆當作「人工訊號」,但是,如果這些答覆如上面所引的那樣令人滿意並且持續下去,我認為他不會將其形容為「簡單的設計」。「簡單的設計」是說用來播放一個人念十四行詩的錄音,並可適時開關。

總之,我認為大多數支援來自意識方面異議的人會被說服而放棄原來的主張,不致於陷入唯我論的困境,這些人因此也就有可能願意接受我們的測試。

我不想給人留下這樣的印象:我認為關於意識的事情沒有神秘感。例如,存在著與任何企圖捕捉意識有關的悖論,但我認為在我們能夠回答我們在本文中關注的問題之前,並不一定要解決這些謎團。

(5)來自各種能力限制的論點

這些論點表述如下:「我擔保,你可以讓機器做任何你提到的事情,可你永遠也不能使一台機器有X類特徵。」這樣的特徵有許多,這裡我列舉若干:善良,機智,美麗,友善,有創新精神,富於幽默感,明辨是非,犯錯誤,墜入愛河,享受草莓和奶油,讓某人愛上它,從經驗中學習,恰當使用辭彙,成為自己思想的主人,像人一樣有多樣的行為,做一些真正新穎的事情(其中一些能力限制在標出的頁碼處有特別的考慮)

這些陳述通常未經證明,我相信它們大多是以科學歸納的原則為基礎的。一個人一生中見過數千台機器,由此得出一般結論:它們形態醜陋,應用範圍狹窄,只要範圍略有變動,就束手無策,行為變化也小,等等。他很自然認為,這就是一般機器的必備特徵。大部分機器的能力限制與機器存儲量大小有關(我假設,存儲量這個概念不僅僅限於離散狀態的機器,還涉及到別的機器,既然目前討論還不需要講究數學的準確性,定義準確就不那麼重要)。數年前,由於很少提及數字電腦,要是你光說其特徵而不提其構造,就會以為你在信口開河。我想這也是因為人們使用了科學歸納原則的結果,這些應用很大程度上是無意識的。當一個被火燙過的小孩害怕蠟燭,從而迴避蠟燭,我認為他這就是在使用科學歸納(當然,我也可以用許多別的方式來解釋這一現象)。人類的行為和習慣是乎並不適合運用於科學的歸納法。如果你想獲得可靠的結果,就要對大部分時空進行研究,否則我們會(像大多數英國兒童一樣)以為世界上所有的人都講英語,學習法語就很愚蠢。

然而,關於剛才提到機器的許多能力限制,還要特別說幾句,說機器沒有能力享受草莓和奶油,會使讀者覺得有點輕率。我們有可能使機器喜歡這些美味,但任何強迫這樣做的企圖都是愚蠢的。值得重視的是,這種能力限制會對解釋其他能力限制有幫助,比如,難以使人與機器之間形成那種像白人與白人之間,或是黑人與黑人之間的友好情感。

宣稱「機器不能犯錯誤」,似乎是一個奇怪的說法,我們不禁要反問,「這樣會更糟嗎?」讓我們抱持更加同情的態度,來看看這究竟是什麼意思。我認為可以用模仿遊戲來解釋這種批評。有人聲稱,在遊戲中提問者簡單問幾道算術題就能分辨出哪個是機器,哪個是人。由於極高的精確性,機器會屏蔽。對此回復很簡單,(編程用於玩遊戲的)機器不會試圖給出算術問題的正確答案,而是故意算錯,以矇騙提問者。機器由於機械故障,會在做算術題時出現錯誤而作出不妥當的決定,因而暴露了自己。即使這種批評不太有同情心,但是限於篇幅不可能進一步討論。在我看來,這種批評源於混淆了兩個不同性質的錯誤,這兩個錯誤我們稱之為「功能錯誤」和「結論錯誤」。功能錯誤是由某些機械或電器故障引起的,這些故障導致機器不能夠按照指令工作。在進行哲學討論時,我們希望忽視發生這種錯誤的可能性,這樣的話,我們實際上是在談論「抽象的機器」,而這些抽象的機器與其說是實在的物體不如說是數學的虛構。從定義上講,我們完全可以這麼說:「機器從不差錯。」只有當機器的輸出訊號有一定的含義時才會出現結論錯誤。比方說,機器能夠自動打出數學方程或英語句子。當機器打出一個錯誤的命題時,我們就認為這台機器犯了結論錯誤。很明顯,找不到絲毫理由說,機器從不犯這類錯誤,一台機器有可能別的什麼也不能做,只會連續打出「0=1」。舉一個不太反常的例子,可能有通過科學歸納得出結論的方法,但這種辦法有時無疑會導致錯誤的結果。

有人說,機器不能成為它自己思維的主體,如果能證明機器的某些思維是有主體的話,就能駁回這種說法。儘管如此,「機器操作的主體問題」確實有點意義,至少對於研究它的人來說是這樣的。比如,如果一台機器試圖解 X2-40X-11=0這個方程式,我們不禁會認為,這時,這個方式本身就是機器主體的一部分。從這種意義上說,機器無疑能夠成為它自己的主體。這對編排它自己的程式,對預測因本身結構變化帶來的後果都會有所幫助,機器能夠通過觀察自己行為的結果,修改自己的程式,以便更有效地達到某種目的。這並不是烏托邦式的空想,而是不久的將來可能辦到的事。

有人批評說,機器的行為比較單一,這也就是說,機器不能夠有很大的存儲能力,直到最近,達到1000位元組的存儲量都很罕見。

我們這裡考慮的批評,實際上都是來自意識的那個異議的改頭換面。通常,如果我們堅持認為,一台機器有能力做完其中的一件事,並對機器所能採用的方法進行描述,不會給別人多深印象,人們會認為機器所使用的方法(不管是什麼方法,總是機械性的)實在太低級了,請參見前面所引Jefferson演講中括弧內的話。 

(6)Lovelace夫人的異議。

關於Babbage分析機最詳細的資訊來自Lovelace夫人的回憶錄,她寫道:「分析機沒有任何創作的意圖, 它可以做我們知道如何指揮它的任何事」(她的斜體),Hartree引用了這段話(第70頁),並補充道:「這並不意味著就無法製造能『獨立思考』的電子設備,用生物學的話說,我們能夠在其中建立條件反射,用來作『學習』的基礎。此設想在原則上否可行,是一個令人刺激和興奮的議題,但當時製造的機器是乎還不具備此特點。

我完全同意Hartree的看法,值得注意的是,他並沒有斷言當時的機器不具備這個特點,而是指出洛夫萊斯夫人所能獲得的證明還不足以使她相信這些機器已具備了這個特點。從某種意義上講,這些機器很有可能已具備了這個特點,因為,我們設想某些離散機器有這個特點,分析機實際上是一台通用數字電腦,因此如果它的存儲能力和速度達到一定程度,就能通過適當的編程模仿我們討論的機器,也許伯爵夫人或Babbage都沒有想到這一點。無論如何,他們沒有義務陳述所有能陳述的事物。

整個問題將在學習機器的標題下再次考慮。

洛夫萊斯夫人的異議還有另外一種說法,即機器「永遠不能創新」,這種說法可以用諺語「太陽底下無新事」抵擋一陣。誰能保證,他的「獨創性工作」不是通過教育讓身上的種子成長的結果,或者不是因循著名的普遍原則的結果?此異議還有另一個稍好的說法,即機器永遠也不能「讓我們吃驚」,這種說法是一個可以直接回應的更直接的挑戰。機器經常令我吃驚,這主要是由於我對機器能做什麼估算不足,更確切地說是由於即使我做了估算,也匆忙粗糙。我也許這樣對自己說:「我認為此處的電壓應與彼處相同:不管怎樣,就假設一樣吧。」自然我經常出錯,結果我大吃一驚,一旦實驗完成,這些假設就被忘得了。我坦誠自己這樣的錯誤,我證實了所經歷的吃驚,但人們並未失信於我。

我的回答並不會使批評者就此緘口沉默,他也許會這樣做,所謂吃驚都是因為我自己富於想像力的心理活動,與機器本身毫不相干。這樣,我們重又回到來自意識的那個論證上去,而背離了吃驚不吃驚的話題。我們不得不認為這種論證方式是封閉式的,但是,也許值得一提的是,要將某事物認作令人吃驚,則需要許多「富於想像力的心理活動」,不管這件令人吃驚的事件是由一個人、一本書、一台機器還是其他任何東西引起的。 

我相信,那種認為機器不會令人吃驚的觀點,是哲學家和數學家特別關注的一個謬誤。它是這樣一個假設,即心靈一接受了某個事實,由此事實所引起的一切後果都會同時湧入心靈。在許多情況下,這種假設十分有用,但人們太容易忘了這是個錯誤的假設,如果照這樣做的話,其必然結果就是認為,僅僅從數據和普遍原則得出結論會毫無效力可言。

(7)來自神經系統連續性的論點。

神經系統當然不是離散狀態機器,撞擊神經元的神經脈衝規模資訊一個小的誤差,就可能導致輸出脈衝規模資訊的很大差別。既然如此,就可以論證:不能期望用一個離散狀態系統去模仿神經系統的行為。

離散狀態機器肯定與連續機器有別,但是如果我們遵循模擬遊戲的條件,提問者就無法利用這種差異。如果我們考察一下其他一些更簡單的連續機器,情況會變得更加清晰。一台微分分析機就足以勝任了(微分分析機是一種用作非離散狀態計算的機器),有些機器能打出答案來,所以可以參加模擬遊戲。一台數字電腦不可能猜准微分分析機對一個問題究竟作何答覆,但它卻能給出正確回答。比如,如果你要它回答π的值是多少(實際上約等於3.1416),它就會在3.12,3.13,3.14,3.15,3.16之間作隨機選擇,其選擇概率依次分別為(比方說)0.05,0.15,0.55,0.19,0.06。這樣的話,提問者就很難分辨微分分析機與數字電腦。

(8)來自行為非形式化的論點

不可能制定一套旨在描述一個人在每種情況該做什麼的規則,比方說,可能有這樣一條規則:行人見到紅燈止步,見到綠燈行走,但是,如果由於某種錯誤紅綠燈同時亮了,該怎麼辦?我們也許會這樣決定,為安全起見最好止步,但稍後這個決定還會有其他問題。試圖提一套考慮到各種可能性的行為規則,即使是如紅綠燈,似乎都是不可能的。對此我完全同意。

由此可見,我們不能成為機器。我會儘力重現此論證,但我擔心很難做到公正。似乎可以這麼說: 「如果每個人都有一套行動規則來調控其生活,那麼他與機器就相差無幾了。但不存在這樣的規則,因此人不能成為機器。「這裡不周延的中項顯而易見,我認為沒人這樣論證過,但實際上用的就是這樣的論證。然而,「行為規則」和「行為規律」之間可能存在一定的混淆,所謂「行為準則」,我是指諸如「見到紅燈止步」這樣的規則,你能採取行動,並意識到;而所謂「行為規律」則是指用於人體的自然法則,例如「如果你捏他,他會叫」。如果我們在引用的論據中用'規範他的生活的行為規律'來替代'規定他的生活的行為規則',那麼,這個論證中的不周延的中項就不再是不可克服的了。因為我們認為,受行為規律調控意味著人就是某種機器(儘管不一定是離散狀態機器),而且反過來說,這樣的機器意味著受這樣規律調控。然而,我們很難輕易地說服自己,不存在完備行為規律,就像不存在完備行為規則一樣。我們知道,找到這些規律的唯一方法是科學觀察,而在任何情況下都不能說「我們已充分尋找過了,不存在這樣的規律。」

我們可以更有力地證明這種說法不合理,假定存在這種規律,我們肯定能夠找到。然後給定一個離散狀態機器,應該有可能通過觀察找到規律,預測其未來行為,在合理的時間內,比如說一千年。 但似乎並非如此,我在曼徹斯特電腦上安裝了一個只有1000個存儲單元的小程式,其中配備有一個十六位數字在兩秒鐘內作出回答。我絕對不相信任何人僅從這些回答中就能充分了解這個程式,能對未試值預測回答。

(9)來自超感官認知的論證。

我假設讀者熟悉超感官知覺的概念,其四種方式為:心靈感應、千里眼、先知和心理動力。這些令人不安的現象似乎否認了一般的科學觀念。我們多麼想懷疑它們!不幸的是統計證據至少對心靈感應是壓倒性支援的。人們很難重新調整自己已有的觀念以接受這些新事物,一個人一旦接受了這些事物,就離相信鬼魂不遠了。走向此方向的第一步是,相信我們的身體除了按照已知的物理學規律運作外,還按照未知的、但相似的規律運作。

在我看來這是一個十分有力的論點。一個人可以這樣回答,許多科學理論儘管同超感知覺有衝突,但實際上還是可行的;事實上,人若是對這些現象置之不理,依然能活得很好。這是一種甚為冷漠的安慰,人害怕思維與超感知覺現象可能有特殊的關係。

基於超感知覺的更具體的論證大致如下:「讓我們來玩模擬遊戲,讓一個善於接受心靈感應的人和一台數字電腦作參賽。提問者可以問『我右手中的那張牌是哪個花色?』這樣的問題。具有心靈感應或千里眼的人在400張牌中可以答對130張,而機器只能隨機猜測,可能答對約104張,因此提問者就能正確的判斷了。」這裡開啟了一個有趣的可能性。假使這台數字電腦有一個隨機數字生成程式,那麼,我們很自然就會用這個程式來決定給予什麼回答。但是,這個隨機數字生成程式又受提問者的精神運動的影響,這個精神運動也許就能讓電腦猜對的次數比概率計算高,於是提問者就無法作出正確的判斷了。而另一方面,提問者也能通過千里眼,不用提問就猜對。有了超感知覺,什麼樣的事都會發生。

如果允許心靈感應介入模擬遊戲,我們就有必要嚴格規定測試方式。此情景就好比在模擬遊戲中,提問者在自言自語,參賽者正貼牆側耳傾聽。要是將參賽者置入一間「防心靈感應室」,就能滿足所有要求。

7,學習機器

讀者會猜測我沒有令人信服的正面論據來支援我的觀點,否則,我就不會花費那麼多精力來指出那些異議中的謬論。現在我就給出這樣的證據。

讓我們暫時回到 Lavelace 夫人的異議,她認為機器只能做我們告訴它做的事,可以說,人給機器"注入"一個想法,機器在某種程度上反應,最後又重新靜止,就像一個被鎚子敲擊的鋼琴弦一樣。另一個比喻就是一個低於臨界體積的原子堆:輸入的想法就像從原子堆外部轟擊的中子,每個中子會引起一些反應但是最後將逐漸消失。然而,如果原子堆的大小變的足夠大的時候,中子產生的反應很可能會持續的增加,直到原子堆解體。思維中是否存在這樣的現象呢?機器中呢?這樣的現象在人腦中應該是存在的。絕大多數思想都處於"亞臨界"狀態,對應於處於亞臨界體積的反應堆,一個想法進入這樣的思想中,平均下來只會產生少於一個的想法。有一小部分思想處於超臨界狀態,進入其中的想法將會產生二級三級越來越多的想法,最終成為一個完整的"理論"。動物的頭腦顯然是處於亞臨界狀態的。由於這種相似性,我們不得不問:"一個機器能不能做成超臨界的?"

"洋蔥皮"的比喻也有用。在研究思維或大腦的功能的時候,我們發現一些操作完全可以用純機械的方式解釋,我們說這並不符合真正的思維。但是在剩下的部分,我們發現還有洋蔥皮需要剝除,一直這樣下去。用這樣的方式,我們是否能夠達到真正的思維,或者最終發現皮裡面什麼也沒有了?如果是後一種情況,那麼整個思維都是機械的。(但它不是一個離散狀態機,我們已經做了說明)

上面兩段並沒有提供令人信服的論據,倒不如稱作「為了產生信仰的背誦"。

為第六部分開始時提出觀點給出真正令人滿意的支援,只能等到本世紀末再進行所描述的實驗了。但是在此期間我們可以說些什麼呢?如果實驗將來會成功,我們現在應該採取什麼步驟?

正如我所解釋,問題主要是編程,工程上的進步也是必要的,但所需不被滿足的可能性似乎不大。估計大腦的存儲能力在10^10到10^15之間,我傾向於下界,而且認為只有一小部分用來進行高級的思考,其餘大部分用來保存影像。在模仿遊戲中對付一個盲人,若所需要的存儲量超過10^9,會讓我驚訝(註:大英百科全書第11版的容量為2*10^9),即使採用現有技術,10^7的存儲量也是完全可行的,也許根本不需要提高機器的運行速度。被視為模擬神經細胞的現代機器,其速度比神經細胞快1000倍,這在許多方面可以為補償速度的損失提供「安全餘地」,剩下的問題主要就是如何編程讓機器能夠完成遊戲。按照我現在的工作速度,我一天大概能編1000位元組的程式,所以大約60個工人在未來50年穩定工作,並且沒有東西扔進廢紙簍,就可以完成這項工作。似乎需要一些更快捷的方法。

在試圖模擬成人大腦的過程中,我們必須考慮大腦是怎麼進入狀態的,有三點:

(a)大腦的初始狀態,即出生時的狀態。

(b)大腦所接受的教育。

(c)大腦所經歷的經驗,此經驗不被稱為教育。

與其試圖編程模擬成人大腦,不如模擬兒童大腦,如果讓兒童大腦接受正確的教育課程,就可能獲得成人大腦。兒童大腦大概就像一個剛從文具店買來的筆記型電腦,只有簡單的機制和許多空白的紙張(機制和寫字在我們看來幾乎同義),我們希望兒童大腦中的機制足夠少使得容易編程。我們可以假設對機器進行教育的工作量和教育一個人類兒童基本相當。

於是,我們把問題分為兩部分:兒童程式和教育過程,兩者密切相關。我們不能指望一下就找到一個好的兒童機器,我們必須對一個這樣的機器進行教育試驗,看其學習效果,然後再試另外一個,判斷哪個更好。顯然這個過程與進化有聯繫,通過這樣類比:

兒童機器的結構 = 遺傳物質

兒童機器的變化 = 變異

試驗者的決定的判斷 = 自然選擇

然而,人們可能希望這個過程比進化更快,適者生存是衡量優勢的一種較慢的方法,試驗者的決定通過智慧實驗將會加快這一過程。同樣重要的是,並不需要局限於隨機的變異,如果能夠找出某些缺陷的原因,就可能想到改進它的變異。

對機器不可能應用與兒童完全相同的教學過程,例如,它沒有腿,因此就不會被要求出去裝煤斗;它也可能沒有眼睛。但是不管聰明的工程師採取何種方法克服這些缺陷,只要這樣的機器被送進人類的學校,其他的學生肯定會嘲笑它,它必須得到專門地訓練。我們不比太注意腿眼等等,海倫.勒女士的例子表明只要老師和學生能夠以某種方式進行雙向的交流,教育就能進行。

我們通常將懲罰和獎勵與教學過程聯繫在一起,一些簡單的兒童機器可以按照這種原則來構建或編程,使得遭到懲罰的事件不大可能重複,而受到獎勵的事件則會增加重複的可能性。我已經用一台這樣的兒童機器做了一些實驗,並成功地教會了它了幾件事情,但其教育方法太不正規以致不能被認為是真正成功的。

懲罰和獎勵的使用最好只是教學過程的一部分,大致說來,如果教師沒有與學生溝通的其他方式,那麼所傳達的資訊量不會超過所用的獎勵和懲罰的總和。當學生只能通過「二十個問題」的方法學習重複Casabianca時,會感到非常痛苦,每個no都會是打擊。因此還必須採用其他的「非情緒」溝通渠道,這樣,通過懲罰和獎勵就能讓機器服從以某種符號語言給出的命令,此命令通過"非情緒"的渠道傳達,這種語言的使用將會大大降低需要懲罰和獎勵的次數。

對於什麼樣的複雜度更適合兒童機器可能有不同的看法,有人主張儘可能簡單以保持通用性,有人主張嵌入一個完整的邏輯推理系統。在後一種情況下,大多數存儲空間將被用來存儲定義和命題,這些命題可能具有各種各樣的形式,例如,確定的事實,推測,數學上證明的定理,權威給出的判斷,具有邏輯形式卻沒有確定值的表達式等等。一些命題可以被稱作「命令」,機器應該設計成當命令確定時立即自動執行合適的動作。例如,如果老師對機器說「現在做你的家庭作業」,這將使「老師說『現在做你的家庭作業』」成為確定的事實;另一個事實可能是「老師說的一切都是對的。」這兩個結合在一起將使「現在做家庭作業」成為確定的事實。而根據機器的構造規則,這意味著立即開始做家庭作業,效果還是令人滿意的。機器的推理過程並不需要像嚴格的邏輯家所為,例如可能沒有類型的層次結構,但這並不意味著出現類型謬誤的幾率會比我們從懸崖摔下的幾率高。合理的命令(在系統內部表達,並不是系統規則的一部分),比如「不要使用一個類,除非它是老師提到類的一個子類」就與「不要讓他接近邊緣」具有相似的效果。

沒有肢體的機器人所能執行的指令具有智力性質,就像上面的例子(做家庭作業)。在這些指令中,最重要的是調節邏輯系統規則的執行順序,因為在使用這個系統的每一步,都會有許多不同選擇,在遵守邏輯系統規則的情況下,任意選擇一個都是允許的。如何選擇將區分聰明推理者還是愚蠢推理者,而不是區分正確推理者還是謬誤推理者。導致這類命令的命題可能是 「當提到蘇格拉底的時候,使用芭芭拉的三段論」 或者「如果有一個方法被證明比另外的方法快,不要使用慢的方法。」這些命題可能來自權威,也可能來自機器本身,例如科學歸納。

學習機器的想法對某些讀者來說似乎有些矛盾,機器的操作規則怎麼能改變呢?無論機器過去經歷什麼,未來會有什麼變化,其操作規則都應該完整地描述機器會如何反應,即這些規則是不隨時間變化的。確實是這樣的,悖論的解釋是,在學習過程中發生變化的規則是一類不那麼自命不凡的規則,只聲稱短暫的有效性。讀者可以將之與美國憲法類比。

學習機器的一個重要特徵是,老師通常對其內部發生的事情不了解,儘管老師仍然可以在一定程度上預測其學生的行為,經過實驗而設計良好(或程式)的兒童機器的後期教育尤其如此。這一點與使用機器進行正常計算的過程形成鮮明對比:那裡的目標是要清楚明白機器在計算中任意時刻的狀態,而要達到此目標則需要付出艱苦的努力。如此,「機器只能按我們的要求做事」的觀點就會顯得很奇怪了,能夠輸入機器的大部分程式終歸會做一些我們無法理解的事情,或者被認為是完全隨機的行為。智慧行為應該和完全服從命令的行為有別,但又不能太大,不應該產生隨機的行為或無限循環。通過教育和學習使我們的機器能夠進行模仿遊戲的一個重要結果是,「人類犯錯誤」可能會被相當自然忽略掉,即不需要專門的「指導」(讀者應該將其與第[454]頁上的觀點調和)。學習的過程並不會產生百分之百的確定結果,否則就不是學習了。

在一個學習機器中加入隨機元素應該是明智的(參見第[445]頁)。當我們尋找某個問題的解時,隨機元素相當有用。例如,我們想找到一個介於50和100之間的數,它等於各個數字的和的平方。我們可以從51,52開始一直試下去直到找到滿足條件的數。另一個方法是隨機的選數直到找到滿足條件的數,這種方法的優點是不需要跟蹤已經嘗試過的值,但缺點是一個數可能重複試兩次,如果存在多個,這點並不很重要。系統化方法的一個缺點,是可能存在很大一段數中並不存在解,但我們需要先判斷它。現在的學習過程可以看成尋找滿足老師的要求(或一些其他的標準)的行為,既然可能存在大量的可能解,隨機方法可能比系統方法更好。應該注意到,在進化過程中有相似的方法,那裡系統方法是不可能的,如何跟蹤已經嘗試過的不同基因組合,從而避免重複呢?

我們希望機器最終能和人在所有純智力領域競爭,但何處是最好的開端?甚至這也成為困難的選擇。許多人認為抽象的活動,例如國際象棋可能是最好的選擇;也有人認為最好用錢給機器買最好的感測器,然後教它聽說英語,和教一個正常的小孩一樣,教它命名事物等等。我並不知道正確的答案,但是我想兩方面都應該試試。

我們的目光所及,只是不遠的前方,但是可以看到,那裡有許多工作要做。