第一屆中國文字學會學術討論會•天津 1996年8月25-30日 電子古籍中的缺字問題 |
Page 4 of 8 |
貳、文字知識在電腦中表達 |
三、字形模式 本系統之字形結構模式如〔圖四〕,〔圖四〕中,12345諸線連接者即〔表四〕中之構字規則。〔表四〕中之「漢字」即此圖中之「漢字字形」。67連接者表示由筆劃組成字根的關係。一個字形的組成可用下面兩個公式表達。
|
五、文字屬性的表達所謂文字的屬性,是指字的一些性質歸屬。傳統字書及今日字辭典中所列者皆是,此外信息處理上用的,如各種輸入碼;統計上的,如使用頻次;語言學上,如詳細的詞性分類;諸如此類皆可納入字的屬性之列。
在本計畫中為缺字收錄的文字屬性如〔表六〕。這些信息是用關聯性資料庫製作的。這部份的電腦技術是相當成熟的,故從略。字集的屬性資料略同於〔表六〕所示,然其細節尚待斟酌。
表六
文字屬性欄位表(註:打”*”者,可以重複)
甲、缺字屬性表
|
Page 4 of 8 |