肆、交換碼的檢討
一時之字形規範,固有其正面之效益和作用,然而也不免產生新的形體而導致漢字字形之累增。近年來大陸推行的簡化字,二次大戰後日本推行的漢字改革,及新近台灣公佈的標準字形等,莫不如此,這些字形新標準的構形,也無一不是根據長久以來民間用字的約定俗成。若無約定俗成的歷史淵源,這些新字形將無由產生,也不可能為廣大民眾順利接受。就文化生命而言,因社會進步,生活環境的變遷而導致文字運用上形體改變的這個生命活力源頭,實應善加維護、珍惜和尊重,否則無異殘傷語文和文化的自然發展法則,並危及漢字適應生存的本能。
漢字交換碼的設計,都遵循各國標準字集,這似乎是理所當,然殊不知國家標準集的訂定,都有其政治目的和前述約制文字的企圖,並非完全依據使用者的需求或漢語文運用的自然法則而訂。處此情境,交換碼可滿足者就會有限度,不可能普及使用者所有的需求,凡涉及歷史、文化之資料,如地名、人名,或用於學術、古籍、藝術等領域,就常顯得過於局限而字不夠用。
計算機要面對的不僅是時下的國家標準字,從使用者的角度來看,計算機面對的是歷史上所有曾經出現過的字,無分正偽、繁簡、雅俗、古今……等區別。亦無所謂現在已不用的「死字」,這些「死字」在你指出它時,它就已復活了!只有用這麼大的胸襟氣度來討論、來設計計算機所需的字集,才不會在資訊科技(information technology)的運用上造成文字、語言和文化上的階級和岐視。
目前交換碼的根本病源,是錯把字形當作字。在此名實不符的情形下,名叫字碼(character code)而實際上卻以字形的差異來判別字。例如,五大碼中饑(C4C8)和飢(B047)分別佔兩個碼位。那麼它們是不是同一個字呢?依碼中的定義,不是;但在語用上實在是同一個字的兩個形罷了。這種情形在各交換碼中比比皆是,連Unicode和ISO10646也不例外。從文字學和語言學的角度看來,這種文字知識的表達根本是錯誤的,不健康的。從科學的角度來看,定義都錯了,往後推演可以勿論。像這種不健康的設計,導致目前應用上捉襟見肘,毛病百出,並不是意外的事。要改善交換碼,自應從此處下手。
此外,應知漢字集合從集合論的觀點來看是一個開放集合(open
set),隨時可能增加字。它和封閉式的字母集合(close
set)不同,字母是不會再增的。這些基本性質的不同,將導致其不同的性質和處理方式。可是,目前的做法卻是套用ISO 646處理字母的方法,來編漢字的碼。這真是削足適履。以上的說明和批評是希望大家了解,要改良現有的交換碼必須要爭脫既有的思考巢臼,否則不會有徹底解決的辦法。以下就是我們根據上述的原則,對改善現有交換碼所提出的方案。 |