文獻處理實驗室 論文目錄

漢字字碼與資料庫國際研討會,京都•東京 1996年10月4日
從缺字問題,談漢字交換碼的重新設計──第一部分

漢字的字形與編碼

Page 2 of 6

貳、綜論

漢字有字形、字音、字義三個要素,是眾所周知的。在此,討論的重點放在「字」與「字形」。這是因為目前計算機的應用,還沒能達到深入處理漢字音義的程度,而且在交換碼的問題上,主要涉及的是字和字形的問題。

自古至今,漢字大抵一字多形。遠古的甲骨文和金文一字數形,學者習以為常。公元150年左右《說文解字》收錄9335字中,即含有1163個重文。這些重文為古文、籀文及或文,都是六書造字的異書同義字。類此者,散見於周禮漢書之重文仍多,有待收錄整理。【註四

從時間軌跡觀之,以往漢字字形的演進主要經歷了甲、金、篆、隸、楷五種字體的嬗變,產生了不少字形結構的差異,然而嬗變之中其字理則同,字義則一。是故數千年來漢字體系始終一貫相承,生生不息:新生的字形賦予漢字當代的適應力與活力,而字形之兼容並蓄則延續了漢字的文化傳承。古今之字書無一不收錄異體字形者,實為漢字一字多形之直接佐證。

從文字學觀之,漢字一字多形固緣於造字五體六書之殊,在用字方面亦有還原通假之需而產生加聲加形者。此即所謂古今字或累加字。這些字固有助於字義的精緻分化,但也是致使漢字多形的根由。

從歷史上觀之,歷代承平之時,多以行政力量規範漢字的字形以益當時語文的利用,如刻石示以正形、考舉約以範式。然而漢民族文化之絢爛發展早已深植於語文之性質中,文學、藝術、思想等莫不受惠於字、詞與字形之彈性與多樣變化。其直接影響者如詩詞歌賦、戲曲、文章、書法等,而日用器皿、建築、庭園、遊戲乃至於人們之價值觀、思考方式,亦難脫構字思維模式的影響。是故歷來規範字形者,僅止於申張文字的正統和導引文字未來的發展方向而已,並無必要將字形變異之自然發展盡納入繩矩。

字形變異之自然發展實源於生活上的需要。隸、楷、行、草和繁、簡之變,皆源於此;而自然發展的通則即眾所周知的約定俗成,這通則也就是漢字與漢語言世代綿延、生生不息的生命力根源。從物質文明發展的過程觀之,文字表達所用的物質和相關的技術革新也造就了不少新的文字形體。紙和印刷術的發明成就了印刷字的形體,近代美工與繪圖工具則創造了許多工藝字形體;這些例子均如實表現漢字字形多變的自然軌跡。

一時之字形規範,固有其正面之效益和作用,然而也不免產生新的形體而導致漢字字形之累增。近年來大陸推行的簡化字,二次大戰後日本推行的漢字改革,及新近台灣公佈的標準字形等,莫不如此,這些字形新標準的構形,也無一不是根據長久以來民間用字的約定俗成。若無約定俗成的歷史淵源,這些新字形將無由產生,也不可能為廣大民眾順利接受。就文化生命而言,因社會進步,生活環境的變遷而導致文字運用上形體改變的這個生命活力源頭,實應善加維護、珍惜和尊重,否則無異殘傷語文和文化的自然發展法則,並危及漢字適應生存的本能。

漢字交換碼的設計,都遵循各國標準字集,這似乎是理所當,然殊不知國家標準集的訂定,都有其政治目的和前述約制文字的企圖,並非完全依據使用者的需求或漢語文運用的自然法則而訂。處此情境,交換碼可滿足者就會有限度,不可能普及使用者所有的需求,凡涉及歷史、文化之資料,如地名、人名,或用於學術、古籍、藝術等領域,就常顯得過於局限而字不夠用。

計算機要面對的不僅是時下的國家標準字,從使用者的角度來看,計算機面對的是歷史上所有曾經出現過的字,無分正偽、繁簡、雅俗、古今……等區別。亦無所謂現在已不用的「死字」,這些「死字」在你指出它時,它就已復活了!只有用這麼大的胸襟氣度來討論、來設計計算機所需的字集,才不會在資訊科技(information technology)的運用上造成文字、語言和文化上的階級和岐視。


註四】 關於文中所談的文字學知識,散見於各文字學書籍,在此不特別引徵。然而,高緒价教授在第一屆中國文字學會學術討論會中發表的《意念造字》一文,(1996年8月),多有所涵蓋,且討論之重點切合計算機之需要,值得參考。


Page 2 of 6
上一頁

論文目錄

下一頁

文獻處理實驗室