行政院科技顧問組
委辦研究計劃 1998年2月
第十二章 可攜式文獻與中文資訊的共享 |
Page 1 of 3 |
朱四明 全球有五分之一的人口使用中文,未來中文必將成為世界語言的主流,而中華文化也必將吸引全球的興趣和重視。在保存中華文化方面,台灣比其他地區有更大的優勢,因此極具潛力成為全球中華文化內容(content)的主要提供者。 網路上資訊內容共享的對象有兩類:一是人們,一是電腦。供人們閱覽的內容重視原貌重現,供電腦處理的內容重視內容標示。換言之,這兩類不同的對象對內容的表達(representation)方式有不同的需求。以下是滿足各個需求的考量。 壹、原貌重現的考量 既使是純文字的內容要在跨平台、跨軟體和跨語言的環境中原貌重現都有極大的困難,遑論多媒體內容的原貌重現。一個折衷的辦法是降低原貌的複雜性,HTML技術就是這種作法。 以HTML為基礎的網頁(web page)是由一些片斷構成的。每一張圖都必須分別產生、妥加標示、並以適當的檔案格式儲存。這些圖形檔格式不是來自任何應用,因此需要經過額外的步驟將之轉換成網上可用的(web-ready)的形式。網頁本身可以由程式語言產生,卻不是資訊開發者習用的工具(如Microsoft Word等)。HTML編輯器固然存在,但最後產生的視覺效果必須在幾種電腦平台和瀏覽器上測試過才能確定。數百年累積的各種字體,在HTML上祇能使用少數幾種而已。最糟糕的是,以HTML製成的內容無法利用十多年來出版界推陳出新的出版工具。 如果規模小,內容的複雜度和製作成本的問題還可以忍受,但從文化傳播的規模來看,這些問題就不能忽視了。何況中文字的複雜性是另一個維度(dimension)的考量。 業界標準(de facto standard)「可攜式文件格式」(Portable Document Format , PDF)使文件的內容原貌重現或高逼真度的呈現不再是夢,原理是把文件的內容、版面資訊以及用到的字型等一併傳給對方,祇要接收端的設備(如螢幕、印表機、音效卡等)功能與發送端相當,而且有符合PDF規格的閱覽器(reader),就可以看到原貌重現或高逼真度的呈現。 接收端閱覽可攜式文件時不需要多國語文的支援,完全自給自足。但是,用PDF表達的文件無法加註內容標示,因此,人工方式還可作有限的再使用,電腦化的再使用就有很大的困難。 國內已有兩個以PDF為基礎的產品可供製作及瀏覽可攜式文件:一為華康的DynaDoc,一為隸南的DocuCom。兩者的功能比較如表一。這些產品的重要考量是,用任何一家產品製成的可攜式文件,祇要別家的瀏覽器符合PDF規格就可以將之原貌重現。從表一中可知華康產生的文件並不完全符合PDF規格。表二對PDF與HTML做了一個比較。 表一 可攜式文件產品比較表
|