文獻處理實驗室 論文目錄

第一屆中國文字學會學術討論會天津 1996年8月25-30日

電子古籍中的缺字問題

Page 4 of 8

貳、文字知識在電腦中表達

三、字形模式

本系統之字形結構模式如〔圖四〕〔圖四〕中,12345諸線連接者即〔表四〕中之構字規則。〔表四〕中之「漢字」即此圖中之「漢字字形」。67連接者表示由筆劃組成字根的關係。一個字形的組成可用下面兩個公式表達。



五、文字屬性的表達

所謂文字的屬性是指字的一些性質歸屬。傳統字書及今日字辭典中所列者皆是此外信息處理上用的如各種輸入碼;統計上的如使用頻次;語言學上如詳細的詞性分類;諸如此類皆可納入字的屬性之列。

在本計畫中為缺字收錄的文字屬性如〔表六〕。這些信息是用關聯性資料庫製作的。這部份的電腦技術是相當成熟的故從略。字集的屬性資料略同於〔表六〕所示然其細節尚待斟酌。

表六 文字屬性欄位表(註:打*者,可以重複)

甲、缺字屬性表

1.缺字統一編號 * 5.筆劃數 * 9.注音
2.交換碼 6.首筆 *10.異體字交換碼
3.內碼(造字檔內) 7.次筆 *11.登錄日期及修改記錄
* 4.部首 8.未筆 *12.提供缺字之各單位欄位
     (含編號及內碼)

乙、字形結構屬性表

1.所屬字集編號 * 5.筆劃 9.部件二
2.交換碼 6.首筆 10.部件三
3.字形碼 7.分解方式 11.字頻次
* 4.部首 8.部件一 12.字根頻次(當用為字根時)
    13.字根次(當用為字根時)

Page 4 of 8
上一頁

下一頁

文獻處理實驗室