文獻處理實驗室 論文目錄

中央研究院資訊科學研究所 1994年4月6日

電子佛典中處理中文版本的方法

Page 7 of 8

陸、文件共享的標準形式

文獻電子化的最大好處,就是可以讓大家充份共享。若把文獻比作資源或是財富,這種財富是不會因共享而減少的,正是所謂:「已所予人已愈有」。如果大家各自擁有的電子文獻可以都拿出來共同享用,那麼,每個人都會變得極為「富有」,國家整體力量也為之大增。反之,若是每個人死抱著自已有的來圖利,就大大屑弱了文獻財富的流通,每個人都因此而「窮困」。所以,做電子文獻,必須要注意到共享的問題。

文獻若要共享,必須要克服一些問題。首先,它要能夠在電子通信網路上流通;其次,他的內容要能夠突破時空的限制,也就是說無論是對認識或不認識的人,無論他在什麼地方,無論他是處於現在或是未來,都要能夠解讀文獻的內容。由於這些緣故,我們必須遵從一些文獻表達的標準來呈現我們的文獻,而這些標準就是 ISO 8879 SGML(Standard Generalized Markup Language ,1986)和它相關文件所定訂的事。以下,就讓我們用例子來說明如何用 SGML來表達多版本文件及其科文。

SGML是用文件類別定義(Document Type Definition,簡稱DTD)來描述文件的結構和語意信息。以佛經之DTD而言,即前述之科文。至於設計用來描述版本轉換關係的 DTD ,我們認為必需考慮接收端可處理性、交換能力和目視的可讀性。版本轉換的關係,可以用 SGML中所訂定的 Process Instruction 、Link Process加以處理,但是如果接收端不能處理這兩種特別的 SGML 功能,就無法交換和共享。再者,對於版本差異的信息,原可以直接放入正字串的文句之間,但是如此一來正字串變得極不易閱讀。因此我們用取代互換四種標誌描述之,並專為使用人設計如表三的轉換程序,與經文分開,這麼做不僅增加可讀性,更方便版本的管理。標誌後的佛經,經由SGML編譯器驗証後即可經由序化(SDIF Packer)進行網路上的傳遞和共享。

《心經》的整個科文,包括「總釋名題」和「正釋經文」,寫成 DTD形式後如圖六所示。圖中英文詞彙和符號全沿用 ISO 8879 之規定,請參照該標準之說明。圖七中(A)顯示的是經過 SGML標誌後之鳩摩羅什本《心經》,而(B)是將本轉換為玄奘本的標誌表達方式。圖六和圖七中呈現的 SGML形式,可從圖五之運作中自動產生。

<!DOCTYPE 心經 [
<!ENTITY % 位置 "起始位置 NUMBER #REQUIRED">
<!ELEMENT 心經 - - (總釋名題?, 正釋經文, 版本轉換*)>
<!ATTLIST 心經 版本 CDATA #REQUIRED>
<!ELEMENT 總釋名題 - - (經題 , 人題)>
<!ELEMENT 經題 - - (綱要, 融會各家, 五重玄義)
<!ELEMENT (綱要, 融會各家) - - (#PCDATA)>
<!ELEMENT 五重玄義 - - (釋名, 顯體, 明宗, 辨用, 判教)>
<!ELEMENT 釋名 - - (通名,別名)>
<!ELEMENT (通名, 別名) - - (#PCDATA)>
<!ELEMENT 顯體 - - (正顯體,辨異同)>
<!ELEMENT (正顯體,辨異同) - - (#PCDATA)>
<!ELEMENT 明宗 - - (正明宗,辨異同)>
<!ELEMENT 正明宗 - - (#PCDATA)>
<!ELEMENT 辨用 - - (#PCDATA)>
<!ELEMENT 判教相 - - (天台, 賢首五教)>
<!ELEMENT 天台 - - (五時, 四教)>
<!ELEMENT 五時 - - (#PCDATA)>
<!ELEMENT 四教 - - (化法,化儀)>
<!ELEMENT (化法,化儀) - - (#PCDATA)>
<!ELEMENT 賢首五教 - - (#PCDATA)>
<!ELEMENT 正釋經文 - - (序分?, 正宗分, 流通分?)
<!ELEMENT 序分 - - (通序, 別序)>
<!ELEMENT (通序, 別序) - - (#PCDATA)>
<!ELEMENT 正宗分 - - (顯說般若, 密說般若)>
<!ELEMENT 流通分 - - (#PCDATA)>
<!ELEMENT 顯說般若 - - (因人顯法, 正示法空, 顯彰妙果, 結讚功能)>
<!ELEMENT 因人顯法 - - (能修之人, 所修之法, 觀行境界, 修證功能)>
<!ELEMENT (能修之人, 所修之法, 觀行境界, 修證功能) - -(#PCDATA)>
<!ATTLIST (能修之人, 所修之法, 觀行境界, 修證功能) %位置;>
<!ELEMENT 正示法空 - - (明蘊空, 顯空德)>
<!ELEMENT 明蘊空 - - (#PCDATA)>
<!ATTLIST 明蘊空 %位置;>
<!ELEMENT 顯空德 - - (總標, 別釋)>
<!ELEMENT 總標 - - (#PCDATA)>
<!ATTLIST 總標 %位置;>
<!ELEMENT 別釋 - - (三科, 十二因緣, 四諦, 智得)>
<!ELEMENT 三科 - - (五蘊, 十二處, 十八界)>
<!ELEMENT (五蘊,十二處,十八界) - - (#PCDATA)>
<!ATTLIST (五蘊, 十二處, 十八界) %位置;>
<!ELEMENT (十二因緣, 四諦, 智得) - - (#PCDATA)>
<!ATTLIST (十二因緣,四諦,智得) %位置;>
<!ELEMENT 顯彰妙果 - - (明菩薩得涅槃, 明諸佛得菩提)>
<!ELEMENT 明菩薩得涅槃 - - (#PCDATA)>
<!ELEMENT 明諸佛得菩提 - - (#PCDATA)>
<!ATTLIST (明菩薩得涅槃, 明諸佛得菩提) %位置;>
<!ELEMENT (結讚功能,密說般若) - - (#PCDATA)>
<!ATTLIST (結讚功能, 密說般若) %位置;>

圖六(A)、《心經》之DTD

 

<!ELEMENT 版本轉換 - - (取代|增|刪|互換)*>
<!ATTLIST 版本轉換 新版本 CDATA #REQUIRED>
<!ELEMENT (取代,增,刪,互換) - O EMPTY>
<!ATTLIST 取代 原文 CDATA #REQUIRED 
     取代為 CDATA #REQUIRED>
<!ATTLIST 增 原文 CDATA #REQUIRED 
       增添詞句 CDATA #REQUIRED>
<!ATTLIST 刪 原文 CDATA #REQUIRED> 
<!ATTLIST 互換 詞句甲 CDATA #REQUIRED 
        詞句乙 CDATA #REQUIRED>
<!-- 此 DTD 巳經由 ARC-Parser 驗證無誤 -- >]>

圖六(B)、《心經》版本轉換之DTD

 

<心經 版本="鳩摩羅什"><正釋經文><顯說般若><因人顯法><能修之人 起始位置= "1">觀世音菩薩。</能修之人><所修之法 起始位置= "6">行深般若波羅蜜時。</所修之法><觀行境界 起始位置="14">照見五陰空。</觀行境界><修證功能 起始位置= "19">度一切苦厄。</修證功能></因人顯法><正示法空><明蘊空 起始位置="24">舍利弗。色空故。無惱壞相。受空故。無受相。想空故。無知相。行空故。無作相。識空故。無覺相。何以故。舍利弗。非色異空。非空異色。色即是空。空即是色。受•想•行•識亦復如是。</明蘊空><顯空德><總標 起始位置="88">舍利弗。是諸法空相。不生。不滅。不垢。不淨。不增。不減。是空法非過去。非未來。非現在。</總標><別釋><三科><五蘊 起始位置="120">是故空中無色。無受•想•行•識。</五蘊><十二處 起始位置="131">無眼•耳•鼻•舌•身•意。無色•聲•香•味•觸•法。7</十二處><十八界 起始位置="145">無眼界。乃至無意識界。</十八界></三科><十二因緣 起始位置="154">無無明。亦無無明盡。乃至無老死。亦無老死盡。</十二因緣><四諦 起始位置="172">無苦•集•滅•道。</四諦><智得 起始位置="177">無智。亦無得。</智得></別釋></顯空德></正示法空><顯彰妙果><明菩薩得涅槃 起始位置="182">以無所得故。菩薩依般若波羅蜜故。心無罣礙。無罣礙故。無有恐怖。遠離一切顛倒夢想苦惱。究竟涅槃。</明菩薩得涅槃><明諸佛得菩提 起始位置="222">三世諸佛。依般若波羅蜜故。得阿耨多羅三藐三菩提。</明諸佛得菩提></顯彰妙果><結讚功能 起始位置="243">故知般若波羅蜜。是大明咒。是無上明咒。是無等等明咒。能除一切苦。真實不虛。</結讚功能></顯說般若><密說般若 起始位置="274">故說般若波羅蜜咒。即說咒曰。揭帝。揭帝。波羅揭帝。波羅僧揭帝。菩提僧莎呵。</密說般若></正釋經文>

圖七(A)、經 SGML標誌後之鳩摩羅什版《心經》

 

<版本轉換 新版本="玄奘"><取代 原文="觀世音菩薩" 取代為="觀自在菩薩"><取代 原文="般若波羅蜜" 取代為="般若波羅蜜多"><取代 原文="舍利弗" 取代為="舍利子"><取代 原文="五陰" 取代為="五蘊"><取代 原文="64 ,4" 取代為="色不異空"><取代 原文="68 ,4" 取代為="空不異色"><取代 原文="86 ,2" 取代為="菩提薩埵"><取代 原文="301, 3" 取代為="莎婆訶"><增 原文="18-" 增添詞句="">< 原文="249-" 增添詞句="是大神咒">< 原文="24 ,37">< 原文="108, 12">< 原文="210, 2">< 原文="257">< 原文="263"></版本轉換></心經>

圖七(B)、從鳩摩羅什本轉換(或對照)到玄奘本之標誌表示


Page 7 of 8
上一頁

論文目錄

下一頁

文獻處理實驗室