文獻處理實驗室 論文目錄

「香港中文大學新亞書院五十週年紀念-21世紀中文圖書館學術會議Nov.1999」 1999年9月30日

從全文資料庫到數位典藏─
中央研究院的發展經驗談
Page 3 of 5

貳、從圖書的數位化到文物的數位化

從1994以後網際網路(Internet)的普及,逐漸改變了人們溝通、處理信息與知識的方式。對社會來說,在此變遷下,知識的取得、擁有和利用也隨之改變;對學術界而言,新的工具引導了研究環境的改變,也擴展了知識領域範疇,新知獲得的速率是前人所料未及的。這些變化雖已驚人,但僅是資訊科技與網際網路,所引發文化巨大變遷中的幾個例子罷了。這個文化變遷,無疑的,將巨幅改變人類的生活形態、社會結構和文明的內涵;而且,此變遷已經開始,勢之所趨無可規避【4】。處此變局,不可避免地,我們要面對從舊到新的轉化過程,「如何把重要的文化資產數位化」就成了我們必須面對的重要新課題。

從圖書與檔案(archives)的分野來看,檔案數位化應較圖書更具效益。一則是因為目前圖書的流通和使用遠比檔案方便;二來檔案是第一手資料,其價值比圖書更珍貴。然而,由於檔案的稀有,使得它在應用上受到很大限制。如果將檔案數位化,廣予流傳,其效果勢必空前。其實,這情形不僅檔案如此,珍貴文物又何嘗不然?所以,從圖書數位化到檔案、文物的數位化是相當自然的,也是在資訊技術急速發展下勢之所趨。

有鑑於此,本院『漢籍電子文獻協調委員會』,在集思廣益努力下,對於本院珍藏文物的保存和應用,也有全面新體認。本文以下,將以此新構想和體認為藍本,作一簡要的說明。

一、數位媒介與文化變遷

    電子媒體有極優越性質,將它數位化的目的是多重的,要言之:一是利於長久保存;其次是數位化後,幾乎取之不盡、用之不竭,可供全民共享;再次是可以大量匯集知識,經相互鉤稽參照,能發前人所未見,產生相輔相成(synergy)的效果;又,如有四通八達的電腦網路,則數位古籍幾乎不須花錢就可以瞬息千里。其實,文化資產數位化的好處並不止這些,以上不過舉其大者而已【5,6】。這就是為什麼聯合國要推動Memory of the World計畫,以及美國推動American Memory,加拿大做Canadian Heritage等等計畫的原因。

    從歷史觀之,任何新媒介的引用,都將導致溝通行為及其效果的改變,也會使得人們在知識處理和發現上產生革命性變化。這兩個變因都對文化影響至為巨大:即新媒介的引用將引發新文明產生。從歷史上觀察,這個因果關係是絕對真實的,因為從來沒有例外。

    有鑑於此,數位媒體將帶動史無前例的文化變遷,這已是學術界不爭的共識。古籍數位化實在是使古籍活出現代風貌最佳、也是唯一的選擇。我國累積有豐富的文化資產,是世界的瑰寶,然而,我們有能力這麼做嗎?我們的環境適合這麼做嗎?時機對嗎?這麼做有什麼社會效益?有什麼前景?想探一探這些問題的企圖心,正是促成本文思考的背景。

二、全觀

    我們明白,如果要將優良的文化資產數位化,是一個極鉅大艱難的過程,不是少數人能做到的,也不是某一個專業可以做成的。這需要全民參與、跨領域合作、並作長期奮鬥,才能成功。因此,鼓勵跨領域,尤其是跨人文社會和科技的合作,至為重要。於此,重視相關計畫之間的溝通協調和合作,發展公用的工具、規格和標準的設立與共享、資訊的透通無阻,以及重視社會整體發展機制之建立和社會效益的評估等,便使得做事的觀念、態度和方法上起了根本上的變化。

三、數位典藏的文化工程

    為建立上述文化主題的數位典藏,必須作該特殊領域中專門知識在電腦中如何表達、如何應用、推廣的研究。於此,應強調對既有資料和知識的整理,以及它們在計算機內部的表達,而不在對文化主題資料的收集,也不在對文化新知的追求,雖然執行的結果一定會獲得相當程度的新知識、新技術和在文化上的創新。數位典藏的建立,實是一項碩大無比的文化工程,含有對固有文化全盤的整理、系統化、以及詮釋和表達等等工作。此工程在資訊技術上,要選擇適當的技術配合,作創意性的應用。建構數位典藏重點之一在於,資訊技術應用於文化上的意義和創新(是know how而不在know why)。是故,技術內涵應具有創新性、通用性、相容性和規範性。

四、文化的共同座標

    由於文化主題有共同的時、空和語言文字基礎,建構共同的時空和語文「坐標」用以安置文化內容,就成為製作文化主題的數位典藏必要的基礎建設。如,共用或相容的地理資訊系統(含時空兩相度)、中外曆法系統、各式語文系統(含時間、語文兩相度)等,它們是可建立為一個共同的環境,讓所有文化主題和所有使用者共用共享的。

五、公共資訊系統

文化無國界,文化資產是全世界人民共有的。於此可推知,應優先鼓勵建構「公共資訊系統【7】」以鼓勵文化交流和共享。此所謂「公共」,對於一個國家而言,是指其使用權是公開屬於大眾、全體納稅人所共有的。換言之,在「正當使用」範圍內,大眾可自由使用。公共資訊著作權和所有權必需清楚,不可有爭議。任何使用者可依清晰合理且公平的條件作二次加值開發。對於公共訊的內容或功能之加值機會,應是人人平等的。然而,目前真正全然屬於公共的資料庫或檔案極少;即使資料是屬於公共的,各式各樣的工具和軟硬體卻未必然。於此,對使用資料庫和網路相關的軟體,如搜尋、瀏覽之工具等應避免壟斷,以使資料庫和資料能共享、可攜(portable)和永續使用。

雖然目前公共的資料庫或檔案極少,然而,屬於公共的原始資訊卻並不少,無數沒有智慧產權的書本、文獻、檔案散居於各機構。因此,將這批資料數位化,便可能建立相當可觀的公共資訊系統。從另一方面看,任何目前私有的資訊,其智慧產權都是有固定期限的;因此,當時過境遷,這些私有資訊終將化為屬於公共的原始資訊。換言之,公共資訊系統的建立,是勢之所趨,無可規避。且公共資訊的認定是建立有價資訊的基礎。換言之,沒有良好的公共資訊系統,則所有的資訊加值將無所依據。此事悠關民生至鉅,建立公用的國家數位典藏作為公共資訊系統的主軸,應該是目前政府不可輕忽的責任。

六、社會效益

此所指之社會效益,大致上可以分為三個方向考慮:一是對教育和學術上的;其次是對相關產業的;再次是對一般國民的貢獻。為求社會效益之成效,應注重其使用時的易用性和親和性。

在考慮社會效益方面,研究、開發、產業和應用四者必須要有密切的聯繫與配合。對產業而言,如軟體產業、加值產業(value-added industry)、內容產業(content industry)等,這些產業雖然都是以資訊業為主,然而其影響與應用絕不限於資訊業,在文化、藝術、社會等等各行各業的應用是可預見的。例如:[表一] 第四點產出清單中,可得知各層次產品均有不同的產業效益。

[表一]:建構數位主題的稽核條目

一 原始典藏概述

  1. 主題名稱

  2. 典藏主題之文化特色與價值

  3. 目前典藏內容概述
    說明文物之品質、數量、來源、結構和組織、歷史背景和相關文件、文獻等。

  4. 典藏文物之所在地、管理維護單位。

  5. 典藏機構之同意書,和對智慧產權的要求。

二 建構之數位典藏說明

  1. 欲數位化之文物清單。

  2. 各種文物數位化之方式和規格(請註明理由)。

  3. 數位典藏主題之內容與其結構、功能。

  4. 說明數位典藏之呈現方式、劇本構想、導覽結構(圖)、參照、注釋解說、檢索功能和使用者界面等。

  5. 逐項說明對此數位典藏智慧產權的要求。

三 資訊技術之運用

  1. 說明整理文物所援用的主要技術,以及整理工作的內容。

  2. 說明典藏文物之資訊,如何在電腦中表達 (representation)。

  3. 說明典藏文物之資訊,在網際網路上傳遞與在終端機上呈現之構想。

  4. 逐項說明所引用之標準和規範,並說明理由。

四 產出之清單

  1. 各個原始的數位檔案(原數位檔)。

  2. 各個已加標誌的原數位檔(標誌檔)。

  3. 各個屬性或背景資料的檔案。

  4. 各個已有主題且已結構化的屬性或背景資料檔案,如主題詞表、索引詞表、索引典、破音字表、近(同)義詞表、詞網等等。

  5. 各個資料庫。

  6. 各個可供參考或共用之工作流程,包括行政上和技術上。

  7. 各個可供參考或共用之程式和系統。

  8. 各個其他申請人認為有價值的產出。


Page 3 of 5
上一頁

論文目錄

下一頁

文獻處理實驗室