漢字印刷字形的整理 6-6

陸、結語

本實驗室從事漢字印刷字形的整理，至今已快滿六年。這些年來，我們將漢字逐字柝分成部件及字根，其中包括Big5的13053個字、《中文大辭典》的49905個字及《漢語大字典》的54727個字，最後找出2600個漢字部件（包含801個字根），並建置成字形資料庫。另外，葉健欣還為《漢語大字典》製作了12套TrueType字型。

建置字形資料庫的主要目的，是為了增加電腦中的漢字信息，當然也有助於缺字的解決。以往各個單位為了解決缺字而不斷的重複造字，有了字形資料庫後，即可透過構字式或部件序取得字型、異體字等相關資訊，以節省缺字的處理成本。各個單位如果在造字的同時，也建立缺字的字形資料庫，必可有效的降低造字檔的轉碼成本。

這六年來，深深覺得漢字字形的整理工作，相當繁複，決非一蹴可幾，祈盼能有更多的人一起加入！

誌　謝

這些年來，每次遇到字形整理的問題，而難以取捨時，感謝謝清俊教授從旁指導，適時將問題解決，讓工作能夠順利進行。另外，更感謝本實驗室的同仁張翠玲、許婉蓉、高孝玖、許永成、邱台鳳，沒有他們這些年來的努力，就沒有現在的字形資料庫。

光碟索取

本實驗室已將這些年來的工作成果，收錄於光碟中，內容包括字形資料庫、異體字表及相關字頻資料，有興趣者歡迎來函索取，來函請寄derming@gate.sinica.edu.tw。

參考文獻

〈中文字形資料庫的設計與運用〉，謝清俊、莊德明、張翠玲、許婉蓉，1995年4月。

〈電子古籍中的缺字問題〉，謝清俊，1996年8月。

〈漢字的字形與編碼〉，謝清俊，1996年10月。

〈A Descriptive Method for Re-engineering Hanzi Information Interchange Codes〉，謝清俊，1996年10月。

〈談古籍檢索的字形問題〉，謝清俊，1997年4月。

〈中央研究院古籍全文資料庫解決缺字問題的方法〉，莊德明、謝清俊，、林晰，1998年5月。

《中文電腦基本用字研究》，林樹編著，交通大學計算與控制學系印行，1972年3月。

〈中國文字之結構模式及其分析〉，倪耿，1972年。

《漢字綜合索引字典》，劉達人、杜敏文、謝清俊、張仲陶、蔡中川、林樹合編，華英出版社，1979年10月。

《中文大辭典》，林尹、高明主編，中國文化大學出版部，1973年10月。

《漢字簡繁體字對照字典》，蘇培成編，台灣珠海出版有限公司，1994年10月。

《漢語大字典》，徐中舒主編，遠東圖書公司，1991年9月。

《漢字漢語基礎》，王寧主編，北京科學出版社，1996年7月。

〈常用次常用國字標準字體楷書母稿〉，教育部國語推行委員會研訂，1993年2月。

〈信息處理用GB 13000.1字符集漢字部件規範〉，大陸國家語言文字工作委員會，1998年5月。

《中文字根孳乳表稿》，周何，國字整理小組編輯出版。