3.2.3喬姆斯基的語言觀
- 2020 年 5 月 7 日
- 筆記
3自然語言
3.1動物的語言
3.2自然語言
3.2.1英文語法考察
3.2.2中文語法考察
3.2.3喬姆斯基的語言觀
前面只就英文與中文進行了簡單的描寫,這當然不能反映人類語言的全貌。世界上有多少種語言並沒有統一的說法,我們估計為4000種左右。對這些不同語種,只是進行類型劃分也是困難的,沒有一種分類能讓每一語種只歸屬於一個類型下。常見的一種劃分是將語言分為分析型與綜合型:
1) 分析型。現今主要的語種都是分析型的,特點:構造不同類型的語法實體,依靠不同類語法實體的配置組合來表達複雜的語義,句子是表達的核心。
2) 綜合型。主要指美洲印弟安語系的一些語種,特點:分析型語言里用多個辭彙組成的句子,綜合型語言里用一個詞來表達,這個詞以動詞成份為中心,再附加眾多不同的詞綴,詞綴同時有的實指的意義與語法的意義。
按上面的標準,典型的分析型語言與典型的綜合型語言間還可以再細分一些中間形態的語言,分析型的語言可進一步劃分為:
- 孤立語。如現代漢語、越南語,特點:沒有形態的變化,語法意義表達主要藉助於詞序與虛詞,虛詞如漢語里的「著」、「了」、「過」、「的」、「地」、「得」。
- 黏著語。如現代日語、朝鮮語、土耳其語,特點:應用多種詞綴,詞綴與語法意義基本是一一對應,表達時需要多種語法意義時就附上多種詞綴,詞根與詞綴,詞綴與詞綴之間是在表達中動態結合的,通常詞綴是後附加方式。
- 屈折語。如英語、阿拉伯語,特點:可以附加詞綴(外部屈折),如goodness=good +ness,也可以內部語音變化(內部屈折)——如drink、drank,來形成不同形態,表達不同語法意義,一種詞綴可對應多種語法意義,詞根詞綴結合相對緊密,內部的屈折可以看作是外部屈折因結合程度過緊發生的變化,詞綴可以從前附加,也可以從後附加。
像其它的社會科學一樣,今天的語言學也充滿了爭論,基於不同的觀點語言學界形成了不同的學派。,當前較有影響的一個學派是美國語言學家諾姆·喬姆斯基(Avram Noam Chomsky,1928-至今)開創轉換-生成語法學派。
喬姆斯基把語言分為語言能力與語言行為二方面(相當於索緒爾的語言與言語,參見第4章)。語言能力追溯至生理上人類智力里已有的「普遍語法」,普遍語法加上不同的參數形成各種具體的人類語言,這些參數是由歷史選擇與積累的,並體現為社會擁有的母語的特徵、使用規則、甚至直覺。語言行為是語言的具體使用與結果。傳統語言學是從語言行為研究語言的,在喬姆斯基看來這是經驗主義的做法。喬姆斯基的語言學是以語言能力為研究對象,期望通過對語言能力的研究可以解釋人類語言的習得機制。相對於經驗主義,喬姆斯基語言研究具有理性主義色彩,喬姆斯基構建形式的符號系統,通過符號系統規則的遞歸應用,可以從基本的詞庫生成所有人類語言語句,包括已有的語句以及潛在無窮的語句。然後通過對這個符號系統的逐步求精可以認知到人類的語言能力。
轉換生成的理論目前仍處於探索與變動之中,最複雜時包括語類、轉換、語義,語音四個子系統以及由深層到表層的多個層次,最新的努力是在追求最簡的方案。我們考察的是喬姆斯基理論早期的短語語法。短語語法的生成規則可圖示如下:
圖中的每一符號表示一個語法類別,最下面豎線表示每一葉子的類別會由具體辭彙替換。
S :表示一個待定句子
NP :表示一個名詞短語
VP :表示一個動詞短語
Det :表示一個定冠詞
AP :表示一個形容詞
N :表示一個名詞
V :表示一個動詞
示意來說,一個句子通過下面的程式進行替換改寫生成。
第一步:初始S
第二步:S=NP+VP
第三步:S=DET+AP+N+VP(替代NP)
第四步:S= DET+AP+N+V+NP2(替代VP)
第五步:S= DET + AP + N + V + DET + N(替代NP2)
第六步:具體的單詞替換上面各位置值,得到具體句子
其中S=NP+VP、NP=DET+AP+N、VP=V+NP、NP=DET+N中右邊表達式對左邊表達式的替換,以及實際單詞對(N、V、AP、DET)的替換就是喬姆斯基理論的語法規則。
短語語法也稱為0-型文法,或無約束文法。一門語言里如果構建一個規則集:P,P能夠生成符合語法的所有語句,或者能判斷每一語句是否符合語法,這個P稱為一個文法。「文法」一詞在這裡可與「語法」一詞通用。除0-型文法外,喬姆斯基及後人還研究了其它的三種文法,並將這些文法理論形式化。P中每一規則可表示A->B,即出現A時可以用B替代,如果B字元串長度大於A,也稱為產生式規則。能夠出現於所有A->B規則的A與B位置的字元,稱為字母表,自然語言里也就是辭彙表,再加上如NP、VP這樣的語類的變項。字母表為非終結符號與終結符號,終結符號是不能再分解的符號,比如說標點符號,終結符形成的集合表示為∑。把終結符反過來理解就是非終結符,非終結符的集合表示為N,N交∑為空集。每一次生成過程,能作為起始的非終結符號稱為識別符號,比如語句類型的變項,識別符號形成的集合表示為S,S是N的一個子集。這樣一個形式的語言可表示為:
G=(N,∑,P,S)
字母表+P={語言里所有的語句}
四種文法從0-型文法開始,每一文法在前一文法基礎上增加對P的約束得到,增加的約束可以是針對產生式P的左邊,也可以是右邊:
- 無約束裝置:0-型文法
語法形式:A->B
約束:
P中至少有一規則A位置出現非終結符號
在滿足約束的條件下,A無條件改寫為B
- 上下文相關裝置:1-型文法
語法形式:XAY—>XBY
新增約束
|A|<=|B|:絕對值符號表示字元長度
且,B位置不能出現S集中字元
在滿足約束的條件,A改寫為B,當A位於左邊是X右邊是Y的序列中
- 上下文無關裝置:2-型文法
語法形式:A—>Z
新增約束:
A位置有且僅有一個非終結字元
在滿足約束的條件下,A無條件改寫為B
- 有限狀態裝置:3-型文法(正則文法)
語法形式:A→ Αb /A→ Bα /A->a。
新增約束:
出現在B位置上字元最多只能是二字字元,兩個字元時必須一個為非終結符,另一個為終結符(小寫字母),而當只有一個字元時,必須為終結符。
在滿足約束的條件下,A無條件改寫為Αb、 或Bα、或a。
喬姆斯基的理論並不適合直接作為自然語言的模型,這也不是評價他理論的方式。喬姆斯基的研究,至少早期的研究中,語義、語用這些方面並不是研究的重點,他是從生成性方向進行抽象,數學化地研究語言,希望能夠解釋自然語言的無限生成性,他的觀點簡單地來說就是:語言是遞歸的替換。在他的理論視角下,他的理論是成功且富於啟發的。
後面會講到,在不依賴於經驗語義的人工語言領域,如電腦程式設計語言,喬姆斯基的理論是真實的理論基礎。喬姆斯基理論的另一價值是:將語言的機制與機器關聯了越來。四種文法正好對應了四種自動機:無約束文法對應圖靈機;上下文有關文法對應線性有界自動機;上下文無關文法對應下推自動機;正則文法對應有效狀態自動機。相關的概念後面有更多的討論。