自然語言語義的數學結構

語言/語文研究以往常被視為較少應用數學的人文學科。不過,此一情況現已有所改觀,今天數學除可作為語言/語文研究的應用工具外(例如「自然語言處理」(natural language processing)便要廣泛應用數學工具),更為某些語言學學科提供基本術語和概念。以語義學為例,當代形式語義學各分支理論都把其基本概念建構於數學概念之上,而且這些數學概念遍及數學各個主要門類(包括數學基礎、代數學、幾何學、分析學這四大門類),以下就各個門類逐一介紹。

「數學基礎」包含集合論、數理邏輯、理論計算機科學等分支學科,這些學科提供最基本的數學術語和概念,如集合、有序n元組、關係、函數、真值、邏輯聯結詞、個體詞、謂詞、量詞、可能世界、模態詞、類型、λ表達式等。形式語義學作為把數學應用於語義學研究的學科,很自然沿用上述這些基本概念,因此不擬對這方面作詳細介紹。這裡只擬指出,形式語義學不僅沿用和繼承上述概念,而且對之作出發展和擴充。其中一個例子是把數理邏輯中的兩個量詞-全稱量詞和存在量詞,大大擴充為廣義量詞,並發展出「廣義量詞理論」(Generalized Quantifier Theory)。另一個例子是把模態邏輯中的「可達性」(accessibility)概念改造成「模態基集」(modal base)和「排序依據」(ordering source)概念,以便更準確地表達自然語言中與認識模態和道義模態相關的詞項(指「必然」、「必須」這類詞),從而發展出「前提語義學」(Premise Semantics)。

「代數學」是繼數學基礎之後在形式語義學中有最廣泛應用的數學門類,這裡的代數主要是指以代數結構作為研究對象的「抽象代數」,而非以求解方程(組)作為研究對象的「方程式論」和「線性代數」。一個「代數結構」是指一個集合連同其上的某些運算,例如實數連同其上的四則運算便構成一個稱為「域」(field)的代數結構。請注意這裡的「運算」(operation)是廣義概念,並不僅指四則運算。例如自然語言的句子(在形式語義學下被處理成命題)雖然不能進行四則運算,但卻可以進行一元的「否定」運算、二元的「合取」運算(即用「和」連接兩個命題)以及二元的「析取」運算(即用「或」連接兩個命題)。此外,還可以把「恆真命題」和「恆假命題」這兩種常值命題看成特殊的零元運算。命題集合連同上述五種運算便構成一個代數結構,稱為「布爾代數」(Boolean algebra)。

我們知道上述五種運算不僅適用於句子,也適用於各級語法結構。以「合取」為例,除了連接句子外,我們還可用「和」連接兩個名詞/動詞/形容詞/副詞/介詞/限定詞等等,以及由這些詞類構成的詞組。在形式語義學中,不僅有由命題構成的布爾代數,還有由各種函數(形式語義學把上述各種詞類處理成各類函數)構成的布爾代數。正由於布爾代數在形式語義學中發揮非常重要的作用,有些人把形式語義學的核心理論稱為「布爾語義學」(Boolean Semantics)。

布爾代數是包含否定運算的代數結構,此一運算適用於陳述句,但卻不適用於疑問句,因為自然語言中不存在否定疑問句(請注意反問句以及特指問句的內部否定,例如「誰沒有來?」,不是嚴格意義的否定疑問句)。不過,自然語言有一種「條件疑問句」(例如「如果張三會來,那麼李四是否也會來?」)。根據「探詢語義學」(Inquisitive Semantics)的研究,這種疑問句可以使用一種稱為「相對偽補」(relative pseudo-complement)的運算來表示,而「相對偽補」可以視為「否定」運算的推廣(請注意在命題邏輯中,否定命題¬p等價於條件命題p → ⟂,其中⟂代表恆假命題)。用「相對偽補」代替「否定」,會得到一個「海廷代數」(Heyting algebra),因此海廷代數可被看成疑問句語義理論的基礎。

除了布爾代數和海廷代數外,還有更一般的代數結構-「格」(lattice),粗略地說,這是指一個帶有前述「和」和「或」運算的有序集合,因此「格理論」構成數學上「序理論」(order theory,即對「次序」的研究)的重要組成部分。在形式語義學中,格可用於「分體論」(mereology,即有關部分-整體關係的理論)的研究,而其成果可用來刻劃「眾數名詞」(plural noun)(註1)和「不可數名詞」(mass noun)等現象,這是因為眾數名詞和不可數名詞正反映一層層有次序的部分-整體關係(例如南海海水是太平洋海水的一部分,而後者又是全球海水的一部分)。

比格更一般的結構是「偏序集」(partially ordered set),這是指滿足某些公理的有序集合(註2)。在自然語言中,有一些現象涉及次序,正可用偏序集來刻劃,而在形式語義/語用學研究中,這些偏序集通常表示成「梯級」(scale),形成一個有關「梯級模型」(scalar model)的理論。在漢語中,「連…都」、「甚至」、「何況」、「只」、「不但…而且」等詞語以及很多成語中的用字,例如「千載不變」中的「千」和「不」的恰當使用都與梯級有關,例如「他不但會做加減法,而且會做乘除法」這句的恰當性便是建基於(會做加減法, 會做乘除法)這個「難度梯級」,如果把這句中的「加減法」和「乘除法」對調,便會得到不恰當的句子。自然語言中還有很多與梯級相關的現象,尚待我們去發掘研究。

接著把話題轉向「幾何學」,即研究形狀、方位等的數學門類。在自然語言中,方位介詞是表示方位的基本詞類,因此幾何學正可用於這些詞類的研究。為刻劃靜態方位介詞(例如英語的inside、behind、above、between等)的語義,形式語義學借用了坐標軸、角度、平行、垂直、距離、相交、投射等概念;而為刻劃動態方位介詞(例如英語的into、out of、towards、through、down等)的語義,則更要引入路徑、軌跡以至幾何變換(包括平移、旋轉、反射等)的概念。

形式語義學對方位介詞的研究一般都是借用幾何學上與空間的點相關的概念,「向量空間語義學」(Vector Space Semantics)(註3)則是借用幾何學上與向量相關的概念,例如向量的起點、終點、模(modulus,即向量的長度)、點積(dot product,由此可推導出角度)等。向量除了是幾何概念外,在物理學上也有廣泛應用,例如用來表示力,因此也能用來刻劃自然語言中某些與力相關的詞項(例如英語的hit)的語義。

在漢語中,某些「分類詞」(classifier)如「張」、「條」、「塊」、「粒」等(註4)的選用常常取決於與之搭配的名詞所代表物體的形狀,有時還要考慮有關物體的「計量」(measurement,指長度、面積、體積等),例如「條」所搭配的名詞一般代表呈長條形的物體。因此如要刻劃這些詞的語義,便要借用幾何學中與形狀、計量相關的概念。

自然語言中有一些現象與事物是否有邊界相關,其中一個現象是時段詞語與動詞「終結性」(telicity)的相關性。在英語中,「in + 時段詞語」和「for + 時段詞語」分别只能用来修飾「終結動詞(詞組)」(代表有終結點的事件)和「非終結動詞(詞組)」(代表沒有終結點的事件),例如He got to the park in ten minutes和He has been walking towards the park for ten minutes。在第一句中,got to the park是終結動詞詞組(以公園作為終結點),所以該句使用介詞in;在第二句中,由於用了towards一詞,其著眼點是「走向公園」的過程而非「到達公園」此一結果(儘管這個結果是可以想像到的),因此這句的動詞詞組是非終結的,故使用介詞for。以上終結和非終結的對立正是拓樸學(註5)中最基本的「開/閉」對立。舉例說,(-∞, 0]是一個右閉區間,其中的0是這個區間右邊的端點;而(-∞, 0)則是一個右開區間,這個區間的右邊沒有端點,請注意0不是這個區間右邊的端點(儘管它是其「上確界」supremum)。

此外,上述開/閉區間概念還被「程度語義學」(Degree Semantics)用來解釋不同形容詞的某些語法差別。舉例說,英語full和empty等形容詞的語義可用閉區間來表示(因為這類形容詞的語義有明確邊界,其中full和empty分別對應著100%和0%這兩個百分比邊界),因此這類形容詞可以用表示完全的程度副詞completely、fully和表示一半的程度副詞half來修飾,從而有completely empty、half full等。反之,tall和short等形容詞的語義則要用開區間來表示(因為這類形容詞的語義沒有明確邊界,例如不存在tall的最高程度),因此這類形容詞不可以用上述程度副詞來修飾,例如*completely tall和*half short等都是不可接受的。

以上指出幾何學(包括拓樸學)概念可用來研究自然語言中表達空間和動力現象的詞語,由於自然語言中廣泛存在「空間隱喻」和「動力隱喻」,上述概念其實還有更廣的應用範圍。首先,很多表示變化的詞語都可被隱喻成從某個抽象空間的某一位置到另一位置的移動,因而可以表示成路徑。以John heated the water by 10°C為例,我們可以運用「事件語義學」(Event Semantics)的基本概念加上路徑函數,把這句處理成「John加熱水」的事件,並且這個事件涉及「溫度」空間中某條從較低區域移向較高區域的路徑,而這條路徑經歷了攝氏10度的距離。

其次,某些非空間詞語所代表的事物雖然沒有一般物體的終結點,但可以隱喻為具有某種抽象終結點,從而解釋某些與空間詞語相似的現象。以He wrote a letter in two hours和He has been writing letters for two hours為例,在第一句中,wrote a letter是終結動詞詞組(其終結點是一個抽象事件:寫完一封信),所以該句使用介詞in;在第二句中,由於用了光桿眾數名詞letters,沒有具體點明要寫完多少封信為止,因此這句的動詞詞組是非終結的,故使用介詞for。

第三,根據認知語義學中有關「動力圖式」(Force Dynamic Schema)的理論,可以把自然語言中表示使役、因果的詞語比喻成不同的(抽象)力相互作用的結果,從而形成「動力理論」(Force-Dynamic Theory)。舉例說,因果句(即「因為…所以」句)可被比喻成某個外力順利產生預期效果的情況,而讓步轉折句(即「雖然…但是」句)則可被比喻成某個外力未能產生預期效果的情況。由於如前所述,向量可用來表示力的作用,因此在形式語義學中,向量可用來表示使役/因果詞語的語義。

接著把話題轉向「分析學」,即研究函數變化的數學門類。分析學主要研究連續函數的變化,並以微分和積分作為其基本運算。在語義學研究中,我們處理的一般都是離散函數,分析學似乎派不上用場。這是僅就形式語義學主流理論的情況而言,由於這些理論都以明晰(crisp)的語言現象(即只有兩種真值-非真即假的語言現象)作為研究對象,因此其相關概念和函數都是離散的。

可是,當我們把研究對象擴大至模糊(vague)語言現象,例如模糊形容詞「胖」、模糊副詞「非常」等時,情況便可能有所不同,這是因為這些現象的真值並非只有兩種,而是可以介乎真與假之間的某個程度,而且可以假設此一程度呈連續變化,所以其相關概念和函數可以是連續的。

當今學術界有多種方法處理模糊現象,一種方法是採用「弗晰集合論」(Fuzzy Set Theory)(註6)。傳統集合論中最基本的關係是個體對集合的「屬於」關係,給定任意個體x和任意集合S,x要麼屬於S,要麼不屬於S,兩者必居其一而且只居其一,因此「屬於」關係可被看成一個二值函數,其值不是1 (代表「屬於」)便是0 (代表「不屬於」)。弗晰集合論則把此一函數改造成一個「隸屬度函數」(membership function),這個函數的值可以是區間[0, 1]中的任何一個實數,代表x屬於S的程度,這樣便把傳統集合論的離散函數改造成一個連續函數。

弗晰集合論雖然在應用科學界和工程學界頗受注目,但在哲學界和語義學界卻不受重視。事實上,後者自行發展了處理模糊現象的理論,其中一個是「超級賦值理論」(Supervaluation Theory)。此一理論克服了弗晰集合論的某些缺點,但它本質上仍是採用離散方式處理模糊現象,因此不能反映介乎真與假之間的各種程度。為彌補此一缺陷,有學者提出用概率來刻劃模糊程度,而概率也是表示成區間[0, 1]中的實數。此外,概率還可用來刻劃多種涉及不確定性的語言現象,例如某些模態句、條件句,以及指類句(generic sentence,指表示穩定恆常事件或狀態的句式,例如「鳥是卵生動物」)等。

由於弗晰集合論和概率論兩者都涉及連續函數,例如弗晰集合論中的隸屬度函數以及概率論中的概率分佈(probability distribution),因此都要應用分析學的理論和工具,這可以從兩個層面去看。

首先,從運算層面去看,當要對連續函數進行某些高級運算時,便難免要使用微積分工具,例如如要就某個連續函數求函數值的(加權)平均值,便要使用「定積分」(definite integral)運算。事實上,概率論中的「期望值」(expected value)就是某個隨機變項的可能結果的加權平均值,當計算連續隨機變項的期望值時,一般要應用定積分。同樣,當把弗晰集合論結合廣義量詞理論以研究自然語言中的模糊量詞(如「幾乎所有」、「大約一半」等)時,便要改變傳統計算量化句真值的方法。當今正有一個這樣的混合理論(以下姑稱為「弗晰量詞理論」),此一理論提出了若干種計算模糊量化句真值的方法,其中一種便要應用定積分,其實質也是在計算不同量化句真值的加權平均值。

其次,在理論層面,概率論的基本概念雖然可以用集合論概念加上一些「組合數學」(Combinatorics)知識來表示,但當學者要建立堅實的理論基礎時,便要引入「測度論」(Measure Theory)概念,而後者正是分析學的一個重要理論。同樣,弗晰集合論的基本概念雖然可以用傳統集合論概念加上一些基礎數學運算(例如求最大、最小值的max、min運算)來表示,但當學者要作更深入的理論研究時,便要引入「弗晰測度」的概念,這同樣要運用分析學的知識。總上所述,分析學對研究模糊語言現象(以及某些不確定語言現象)起著一定作用。

惟須指出,當今形式語義學對概率的應用主要還停留在紙上談兵的階段,現時仍未形成成熟的「概率語義學」或類似理論,更遑論用微積分工具計算期望值。雖然已出現前述的弗晰量詞理論,但此理論跟弗晰集合論一樣,在形式語義學中不受重視,充其量只佔據一個邊緣位置。究其原因,可能是因為形式語義學是一個理論為本(而非應用為本)的學科,不很重視具體的數值計算結果。

以上介紹了數學基礎、代數學、幾何學、分析學概念在當今形式語義學的作用。相信隨著理論繼續發展,形式語義學將來還會使用更多更深的數學概念。

註1:內地一般把plural譯作「複數」,但由於「複數」一詞也用來作為數學上complex number的譯名,為免引起混淆,我主張採用香港習用的譯名「眾數」。

註2:表面上看,偏序集概念似乎不涉及運算,但從「偏序」概念可以引伸出「上/下確界」(supremum / infinmum)概念,再進而引伸出「并/交」(join / meet)運算,這兩個運算就是前述「析取/合取」運算的推廣。

註3:「向量空間」是一種代數結構,屬於代數學的研究範圍。不過,向量空間語義學主要是應用向量的幾何性質,因此本文把這種語義學視作對幾何學(而非代數學)的應用。

註4:傳統漢語語法一般把這類詞稱為「量詞」,但為避免與數理邏輯中的quantifier (一般譯作「量詞」)混淆,本文把這類詞稱為「分類詞」。

註5:本文為方便敘述,把拓樸學當作幾何學的分支(儘管很多人把拓樸學視作獨立的數學門類)。請注意日本人一般把topology譯作「位相幾何學」,由此可見拓樸學與幾何學的密切關係。

註6:內地一般把fuzzy set譯作「模糊集合」,但由於「模糊」一詞也用來作為vague的譯名,而fuzzy set只是處理模糊現象的眾多方法之一,因此我認為最適宜把fuzzy set譯作「弗晰集合」,此一譯名既能反映讀音,又能反映意義-「弗晰」就是「不明晰」的意思。

返回語言學專題