漢字優劣論衡

漢字作為漢族(以及多個少數民族)共同使用的文字,在歷史上曾起著統一漢民族的重要作用。由於漢語存在多種方言,各種方言的發音差異可以很大,說不同方言之間的人竟至互相不能聽懂對方說話的地步。西方有些語言學家正是以此作為論據,指出中國的不同方言根本就是不同的語言。如果漢族採用拼音法書寫漢字,那麼漢字勢必分化為拼法各不相同的文字,不利統一。

事實上,當代比較文字學指出,由於表意文字(註1)的表意功能並不依賴字的發音,它能用來代表多種方言(乃至語言),可以起著一種超方言(或甚至超語言)的作用。例如「雲南規範彝文」便是雲南彝語的超方言文字,雖然雲南彝語的各種方言差異很大,但是雲南的彝族人卻可使用共同的規範彝文,即使在口頭語言上不通,也可用文字溝通,因此「雲南規範彝文」成為雲南彝族人用來超越方言阻隔的書面溝通工具。由此可見,上述優點並非漢字所獨有,也是其他某些表意文字的特點。

另外,漢字的方塊性質也構成漢字的某些藝術美。由於方塊文字具有整齊工整的特點,漢字不僅是傳達信息的工具,也是一種美術媒介。由於漢字形體不一,書法家有較大的空間選擇適合的字形以配合其書法藝術的構圖。除了書法外,在漢語詩詞文化中為人津津樂道的回文、藏頭詩、對聯等等,也是充分發揮方塊字特點的傑作。假如漢字不是方塊字,而是像英文那樣每個詞長短不一,如何能造到上述這些藝術效果?因此可以說,漢字的方塊性質使漢字的詩詞不僅具有聽覺美,而且兼有視覺美。

漢字的方塊性質(亦即二維性)還有一個優點,就是能夠在較小面積內負載較多信息,因而較一維的字母文字節省空間。人們常常拿以下例子證明漢字的這個優點:在聯合國六種工作語言的文件中,以漢字印刷的文件所佔空間最小(註2)。

漢字的「意音文字」特點(主要表現在形聲字中)也具有某些優點。由於意音文字既表音亦表意,因此這種文字承載了較多信息。例如漢字的形聲字便提供了雙重信息:語音信息和意義信息。因此當我們初次接觸一個完全陌生的形聲字時,即使不能完全理解其意思及準確讀音,也能推敲其近似讀音和所屬的意義範疇。例如如果我們看見一個新造的代表某化學元素名稱的字乃從「金」旁,便可得知這種元素是一種金屬,這一特點是純表音文字所不具備的。

漢字的意音文字性質其實還有一個重要作用,就是解決漢字存在大量同音字的問題。古漢語以單音節詞佔絕對多數,如果採用純表音文字,勢必造成大量同音同形字,導致同一個字承載太多意義,不利溝通,所以漢字的形旁實有幫助辨義和分化同音字的作用。因此漢字的意音性質是有其合理性,不得不然的(這也是現代漢語難以實行拉丁化的其中一個原因)。不過究竟是因為古漢語多同音字導致我們的祖先須用意音文字,還是因為漢語用了意音文字導致我們的祖先容忍大量同音字的存在,這似乎是雞與雞蛋的問題。

從另一個角度看,漢字的上述優點同時也就是它的缺點。假如我們採取中國語言文字學家周有光在其著作《世界文字發展史》中的文字發展觀點(即文字從「表意文字」-->「意音文字」-->「音節拼音文字」-->「字母拼音文字」的演變是一個進步的過程),那麼漢字作為一種意音文字,在發展進程上是落後於佔世界主流的拼音文字的。事實上,周有光的觀點也不無道理。由於漢字大部分既表意又表音,因此較純表音文字需要使用多得多的符號作為表意符號。即使只考慮純粹表音的聲旁,漢字也比不上拼音文字。首先,漢字的聲旁是以音節為單位的,不能分析為哪一部分代表聲母,哪一部分代表韻母,因此漢字的聲旁數目比拼音文字的字母數目多很多。即使撇開這一點不談,漢字的聲旁仍有一個嚴重缺點,就是無系統性,例如同樣表達jiao這個音的聲旁便至少有「交」、「焦」、「喬」、「堯」這幾個,導致漢字形體不一,難學難記。

漢字的另一個缺點是不利於信息處理(包括詞典、名冊、電腦中的文字排序、檢索等)。字母文字有固定的字母順序,這一點對於信息處理是非常重要的。漢字作為一種非字母文字,本來便缺乏一種天然的排序依據。雖然歷來的學者已力圖尋找方法克服這種弱點,例如採取部首、筆畫(註3)、四角號碼等方法為漢字尋找排序依據,可是這些方法都存在這樣那樣的缺點。首先,缺乏共識可以說是這些方法的致命傷。以筆畫排序為例,究竟漢字排序應採取多少種筆畫,各種筆畫的順序如何,就真是各師各法,莫衷一是。部首排序法也是如此。從《說文解字》到《康熙字典》以至今天的字典,所用部首的數目不一,順序也不一。即使在今天,仍沒有全民族一致採用的部首總表。內地和臺灣各有一套系統,例如內地某些字典承認「l」為一個部首,傳統的臺灣(香港也是)字典卻把「l」旁的字歸入「水」部。

即使把上述順序問題解決了,如何根據這些筆畫、部首把漢字排序仍然存在很大的問題。首先排序方式不直觀,一般人須經過一番「訓練」和強記才能掌握。以筆畫數為例,給定一個漢字,首先便得數數它有多少筆畫,單是這一點便已給字母比下去了。在數筆畫時,如何確定何謂一畫,也並不直觀,而且存在可爭拗之處,普通人常常難以確定一個字的確切筆畫數。部首也是如此,某些字的部首難以確定,而且還有大量不能劃歸部首的「難查字」存在。

漢字的信息處理還有另一種困難,就是難以使用一套標準貫徹始終地把所有漢字歸類和排序。我們在檢索漢字時總得綜合使用兩種或更多種標準,例如傳統的字典便是綜合使用部首和筆畫數這兩套標準來為漢字排序的。即使現代以漢語拼音作為排序標準的字典仍然迴避不了這個問題,這是因為漢字存在大量同音字,不可能純粹根據拼音來排序,而必須引入其他排序標準(例如筆畫數)以作輔助。

在現代中文輸入技術方面,上述問題便表現為「同碼字」的問題。可以說,現在各種中文輸入法都是為了解決同碼字問題而作出了不同的取捨,但每種輸入法都總是各有利弊,不能面面俱到。以「拼音輸入法」為例,雖然對於懂得拼音(不論是漢語拼音還是方言拼音)的人來說,拼音輸入法是最直觀和無需學習的輸入法,可是這種輸入法的弱點就是存在大量同碼(即同音)字。相反,「內碼輸入法」雖然為每一個漢字硬性編配了一個內碼,從而完全解決了同碼字的問題,但是這種輸入法的致命弱點就是完全沒有直觀性。使用這種輸入法的人必須死記每一個字的內碼,這無疑是費時失事的。除了上述兩種輸入法外,其他輸入法也在直觀性和避免同碼字這兩個要求之間作出不同取捨。直觀性較強、不用太多學習時間的輸入法(如簡易、九方)難以避免大量同碼字的存在,而同碼字甚少的輸入法(如倉頡)卻直觀性低,難於學習。由此可見,漢字的弱點確實為信息時代的中國人帶來很多麻煩,使我們不得不花費很多力氣和金錢解決這些問題,而且每種方法都不能完全解決問題,這就是為何今天有多種中文輸入法同時存在的原因了。

漢字的二維性(即非線性)也造成一些問題,就是字型結構無系統性,這同樣為信息處理帶來一些問題。線性的字母文字有天然的書寫順序,但二維的漢字在某些時候便難以確定順序。具體漢字的筆順歷來便不是完全有共識的。雖然筆順問題似乎只是個人寫字習慣的問題,但在信息時代這卻為漢字的信息處理造成極大不便。除了為筆順排序帶來難題外,它也為「四角號碼」排序法和以漢字形體為依據的各種中文字電腦輸入法帶來很多問題。以四角號碼和倉頡輸入法為例,如何拆字(即選定哪一部位用來編碼,並在選定後把該部位劃歸哪一號碼或哪一倉頡字母)有時便不是容易的事,很多時候只能強記。

漢字形體無系統性的另一個表現是部件繁多而且難以稱說,這對於提高漢字識字率無疑是不利的。近代中國歷屆政府以及新加坡、馬來西亞等地推行簡化字,其目的就是要紓緩這種困難。試比較字母文字和漢字的教寫字方式,便可見問題的所在。對於字母文字,教一個人一個新詞,只需把字母「串」(spell)出來便行,可是漢字卻沒有那麼簡單。試想想如何教一個不懂如何寫「鬱」字的人寫這個字。十居其九只能寫出來給他看,而不能「告訴」他怎樣寫。這不僅僅是字形複雜的問題,也是漢字部件類型多和難以稱說的問題。

綜上所述,漢字的優點較多是政治上和美術上的優點,它作為多方言(以至多民族)的中國的官方文字,起著促進統一的重要作用。而經過歷代文人充分發揮漢字的美術優點後,漢字亦成為中華民族的珍貴文化財產。可以說,漢字的優點主要是歷史性的。可是,在與現代科技(特別是資訊科技)配合方面,漢字卻顯出多種不足之處。尤其是在信息處理方面,漢字跟字母文字比較,無疑顯得與現代信息技術格格不入。中國人要比使用字母文字的人付出較多代價(例如須開發和學習各種中文輸入法、須額外增補ASCII碼以外專門用來代表漢字的字符),以適應現代信息科技的需要。


註1:嚴格地說,漢字是一種「意音文字」而非純粹的「表意文字」,因為佔現代漢字絕大多數的「形聲字」是既表音,亦表意的。不過,由於漢字的表音方法不很系統化,漢字具有較多的「表意文字」特徵。

註2:在邏輯上說,方塊字與意音文字並無必然聯繫。理論上,意音文字也可以是線性的,只要在書寫方法上把各種部件水平並排便成。同樣,拼音文字也可以是方塊字。例如朝鮮和韓國的諺文採用音節字母拼音,但在書寫方法上卻模倣漢字的佈局寫成二維的方塊字。因此漢字方塊性的優點是跟它的其他優點互相獨立的。另外,曾有人做過一個「實驗」,把英文寫成方塊字的形式,即模倣漢字的形體結構把英語的一個音節(漢字的每個「字」相當於一個音節)寫在一個方框內。例如英語詞"hand"可以寫成這樣:,把"h"寫成一個偏旁,放在方框的左邊,然後把"a"、"n"、"d"這三個字母垂直並排於方框的右邊。上述「實驗」顯示,假如把英語詞的每個音節也寫成方塊字形式,那麼英文文件所佔的空間與中文文件不相上下。

註3:「筆畫排序法」這個概念其實存在多種不同的意思,其中一個意思是指按「筆畫數」排序,把所有具有相同筆畫數的字放在一起。例如「丁」字和「人」字同屬兩畫,於是便把它們歸在「兩畫」的類屬下。另一個意思則是根據某種既定的「筆順」排序,即不考慮某字的筆畫數,而只根據該字筆畫的書寫順序排序,把所有以相同筆畫起筆的字放在一起。例如「廣」字和「鄺」字的筆畫數雖然不同,但由於兩者開首十幾個筆畫的筆順都相同(即都是先點、然後橫、然後撇......),因此在這種排序法下這兩個字將被放在非常接近的位置。不過在實際排序時,一般人很少會純粹根據筆畫數或筆順來排序,而是綜合使用這兩種標準。例如最常見的方法便是先把同筆畫數的字歸類,然後再按筆順把有相同筆畫數的字排序。

周家發的語言學網頁