文獻處理實驗室 論文目錄

中國古籍整理研究出版現代化國際會議•北京 1995年7月22-24日

古籍校讀工具
「中文文獻處理系統」的設計

Page 1 of 5

謝清俊、莊德明

摘要

本文探討計算機如何處理古籍,問題涉及:古籍之版本、注疏、以及今人所加之註釋等在計算機中的表達、檢索、對映、參照、和應用等。文中採用《心經》為例,說明設計的理念和所發展的軟體工具「中文文獻處理系統」(CDP)。

CDP是一個通用的工具,其應用之對象並不限於處理古籍,然而在本文中僅針對古籍特有的性質和問題而提出討論。CDP可視為一種超文件(Hypertext)系統,它包含文件本身,文件之間相連的關系,以及檢索和瀏覽的功能等。文件間的關係是透過「知識結構」相連的。知識結構種類繁多,本文僅舉類似分類的樹狀結構為例加以說明。

此系統目前已可處理古籍各版本間之對映、注疏和相關資料與原文間之參照,以及原文內容之標誌等。CDP尚在開發之中,本文所報告者僅為初步之進展。

Abstract

A hypertext tool, the Chinese Document Processor (CDP) and its application to ancient document are presented in this paper. The design of CDP will be explained around the themes of handling various versions of original document and their related explanatory documents.

CDP provides a friendly interactive way of doing 'content markup' of documents by linking the designated text string to generic knowledge structures. In this paper, for simplicity and clarity, we selected the Heart Sutra(心經) as the original document and its Ker-wen (科文), a skeleton of the content) as the generic knowledge structure to illustrate the techniques of representing various versions, providing matching, browsing, and retrieving of ancient documents.

 

壹、前言

本文以佛教經典《心經》的諸版本及相關的注疏文件為例,探討計算機如何處理古籍的問題。討論的內容包括:古籍的各種版本,它的古今注疏釋譯等在計算機中如何表達,如何瀏覽、檢索、參照、以及應用等問題。

為此,我們開發了一套軟體工具「中文文獻處理系統」(Chinese Document Processor, CDP)來完成上述的任務。CDP是一個通用工具,處理的對象並不限於古文件。它是一具有超文件(hypertext)性質的工具,以文件的字串和某種知識結構間關聯的關係作為超文件的鍵(links),把文件內容與相關知識連接成一網路,以提供瀏覽、對映、檢索、參照等功能。CDP的雛型已完成,然而它的功能和結構並未完備,尚在改良和發展中。

選擇《心經》為例是為了簡潔。《心經》最小的版本才260字,注疏釋譯甚多,且有極佳的內容綱要(即關於它的內容的知識結構)甚合適作為本文之題例。此外,佛經的結構較一般文章有規律,它們有共同的結構,而顯示這結構和其內容綱要的文字稱為它的科文(或科判)。換言之,科文是一個樹狀結構的經文提要,比目錄還詳細,以往主要用於方便解釋或檢索經文。在計算機裡,科文正可用做經文的內容、主題、或文句等的檢索和比對。若為一般古籍比照佛經編一科文(或編一較詳細的目錄),則此古籍即可適用於本研究提出的系統。

本文用CDP對治古籍主要從兩個功能上著想,其一是從版本問題下手,以校讎為重點。在漢學研究的領域裡,無論是考據之學或是義理之學,版本問題都居首要,是故本研究應該對古籍之電子化具有積極的意義。其次是古籍的研讀。在此包括古籍及其相關資料之匯集,內容之鉤稽對映,瀏覽檢索等。根據這些功能需求,建立超文件式的全文資料庫是自然的想法。根據此二主要功能,本文將CDP釋名為古籍校讀工具。


Page 1 of 5
上一頁

論文目錄

下一頁

文獻處理實驗室