文獻處理實驗室 論文目錄

「電子古籍中的文字問題研討會」 1999年6月14-16日

漢字印刷字形的整理

Page 6 of 6

陸、結語

本實驗室從事漢字印刷字形的整理,至今已快滿六年。這些年來,我們將漢字逐字柝分成部件及字根,其中包括Big513053個字、《中文大辭典》的49905個字及《漢語大字典》的54727個字,最後找出2600個漢字部件(包含801個字根),並建置成字形資料庫。另外,葉健欣還為《漢語大字典》製作了12TrueType字型。

建置字形資料庫的主要目的,是為了增加電腦中的漢字信息,當然也有助於缺字的解決。以往各個單位為了解決缺字而不斷的重複造字,有了字形資料庫後,即可透過構字式或部件序取得字型、異體字等相關資訊,以節省缺字的處理成本。各個單位如果在造字的同時,也建立缺字的字形資料庫,必可有效的降低造字檔的轉碼成本。

這六年來,深深覺得漢字字形的整理工作,相當繁複,決非一蹴可幾,祈盼能有更多的人一起加入!

誌 謝

這些年來,每次遇到字形整理的問題,而難以取捨時,感謝謝清俊教授從旁指導,適時將問題解決,讓工作能夠順利進行。另外,更感謝本實驗室的同仁張翠玲、許婉蓉、高孝玖、許永成、邱台鳳,沒有他們這些年來的努力,就沒有現在的字形資料庫。

光碟索取

本實驗室已將這些年來的工作成果,收錄於光碟中,內容包括字形資料庫、異體字表及相關字頻資料,有興趣者歡迎來函索取,來函請寄derming@gate.sinica.edu.tw

參考文獻

  1. 〈中文字形資料庫的設計與運用〉,謝清俊、莊德明、張翠玲、許婉蓉,19954月。
  2. 〈電子古籍中的缺字問題〉,謝清俊,19968月。
  3. 〈漢字的字形與編碼〉,謝清俊,199610月。
  4. A Descriptive Method for Re-engineering Hanzi Information Interchange Codes〉,謝清俊,199610月。
  5. 〈談古籍檢索的字形問題〉,謝清俊,19974月。
  6. 〈中央研究院古籍全文資料庫解決缺字問題的方法〉,莊德明、謝清俊,、林晰,19985月。
  7. 《中文電腦基本用字研究》,林樹編著,交通大學計算與控制學系印行,19723月。
  8. 〈中國文字之結構模式及其分析〉,倪耿,1972年。
  9. 《漢字綜合索引字典》,劉達人、杜敏文、謝清俊、張仲陶、蔡中川、林樹合編,華英出版社,197910月。
  10. 《中文大辭典》,林尹、高明主編,中國文化大學出版部,197310月。
  11. 《漢字簡繁體字對照字典》,蘇培成編,台灣珠海出版有限公司,199410月。
  12. 《漢語大字典》,徐中舒主編,遠東圖書公司,19919月。
  13. 《漢字漢語基礎》,王寧主編,北京科學出版社,19967月。
  14. 〈常用次常用國字標準字體楷書母稿〉,教育部國語推行委員會研訂,19932月。
  15. 〈信息處理用GB 13000.1字符集漢字部件規範〉,大陸國家語言文字工作委員會,19985月。
  16. 《中文字根孳乳表稿》,周何,國字整理小組編輯出版。

Page 6 of 6
上一頁

論文目錄

下一頁

文獻處理實驗室