「電子古籍中的文字問題研討會」 1999年6月14-16日 漢字印刷字形的整理 |
Page 6 of 6 |
陸、結語
本實驗室從事漢字印刷字形的整理,至今已快滿六年。這些年來,我們將漢字逐字柝分成部件及字根,其中包括 Big5的13053個字、《中文大辭典》的49905個字及《漢語大字典》的54727個字,最後找出2600個漢字部件(包含801個字根),並建置成字形資料庫。另外,葉健欣還為《漢語大字典》製作了12套TrueType字型。建置字形資料庫的主要目的,是為了增加電腦中的漢字信息,當然也有助於缺字的解決。以往各個單位為了解決缺字而不斷的重複造字,有了字形資料庫後,即可透過構字式或部件序取得字型、異體字等相關資訊,以節省缺字的處理成本。各個單位如果在造字的同時,也建立缺字的字形資料庫,必可有效的降低造字檔的轉碼成本。 這六年來,深深覺得漢字字形的整理工作,相當繁複,決非一蹴可幾,祈盼能有更多的人一起加入! 誌 謝這些年來,每次遇到字形整理的問題,而難以取捨時,感謝謝清俊教授從旁指導,適時將問題解決,讓工作能夠順利進行。另外,更感謝本實驗室的同仁張翠玲、許婉蓉、高孝玖、許永成、邱台鳳,沒有他們這些年來的努力,就沒有現在的字形資料庫。 光碟索取本實驗室已將這些年來的工作成果,收錄於光碟中,內容包括字形資料庫、異體字表及相關字頻資料,有興趣者歡迎來函索取,來函請寄derming@gate.sinica.edu.tw。 參考文獻
|
Page 6 of 6 |