文獻處理實驗室 專案計畫

行政院科技顧問組 委辦研究計劃 1998年2月

第十一章    漢字的構字規律和解決缺字問題的方法

Page 5 of 10

伍、文字的制式定義與表達

字、字形、字體這些名詞在我們語用中常常代表著不盡相同的意思但佐以情境我們並不覺得有溝通的障礙。可是電腦遠沒有人靈活也沒情境可參照所以必需對這些名詞作制式的界定電腦才能據以順利地處理文字信息。

(character)是表達一種或一群概念的名相。它是抽象的以語意區別。例如對應的繁體和簡體是同一個字。在電腦中字用一個識別碼(identifier)表示此識別碼可以是交換碼也可以是內部處理方便使用的「內碼」或是輸入時的「輸入碼」。目前字所承載的語意還沒能表達在系統中所以電腦並沒有方法可以直接處理語意信息。

如前所述一個字可能有許多字形(glyph)。字形也抽象的區別字形的關鍵在於它的組成結構亦即構字如前例繁體和簡體屬於不同的字形。偶爾也有些字會用同一字形的。所以以數學關係來說字之於字形大多數是一對一或一對多的關係偶有例外。

字形只界定構字並不關心該字好不好看。依同一規範製作的一群字屬於同一種字體(font)。字體也是抽象的區別的關鍵在於它的設計規範。雖然字體有設計規範以表現其劃一的特色,但仍有藝術創作的空間允許設計者表現自己的風格。所以同一字體下各廠商設計的「字型(style)」會現出不同的表情、風貌。一種字型設計通常有些參數來決定它呈現的大小、粗細、橫直粗細比列、疏密以及一些特殊裝飾的邊角等等。待這些參數選定了才能借媒介呈現出這個字的面貌此稱為字樣(typeface)。唯有字樣才是具體可見的。照理說這些字體和字型在設計上產生的形狀變化(以下簡稱為字體變化)是不應該違反構字規律(即字形的定義)的然而在實務上並沒有這麼嚴謹也造成了些字形上的差異。上述的關係可參見〔圖一〕。所謂文字的制式表達即將〔圖一〕中的關係用電腦能了解的方式表達在電腦中。

[圖一]:字、字形、字體和字樣

[圖一]:字、字形、字體和字樣


Page 5 of 10
上一頁

回目錄

下一頁

文獻處理實驗室