文獻處理實驗室 專案計畫

行政院科技顧問組 委辦研究計劃 1998年2月

第十二章 可攜式文獻與中文資訊的共享

Page 1 of 3

朱四明

全球有五分之一的人口使用中文,未來中文必將成為世界語言的主流,而中華文化也必將吸引全球的興趣和重視。在保存中華文化方面,台灣比其他地區有更大的優勢,因此極具潛力成為全球中華文化內容(content)的主要提供者。

網路上資訊內容共享的對象有兩類:一是人們,一是電腦。供人們閱覽的內容重視原貌重現,供電腦處理的內容重視內容標示。換言之,這兩類不同的對象對內容的表達(representation)方式有不同的需求。以下是滿足各個需求的考量。

壹、原貌重現的考量

既使是純文字的內容要在跨平台、跨軟體和跨語言的環境中原貌重現都有極大的困難,遑論多媒體內容的原貌重現。一個折衷的辦法是降低原貌的複雜性,HTML技術就是這種作法。

HTML為基礎的網頁(web page)是由一些片斷構成的。每一張圖都必須分別產生、妥加標示、並以適當的檔案格式儲存。這些圖形檔格式不是來自任何應用,因此需要經過額外的步驟將之轉換成網上可用的(web-ready)的形式。網頁本身可以由程式語言產生,卻不是資訊開發者習用的工具(如Microsoft Word等)。HTML編輯器固然存在,但最後產生的視覺效果必須在幾種電腦平台和瀏覽器上測試過才能確定。數百年累積的各種字體,在HTML上祇能使用少數幾種而已。最糟糕的是,以HTML製成的內容無法利用十多年來出版界推陳出新的出版工具。

如果規模小,內容的複雜度和製作成本的問題還可以忍受,但從文化傳播的規模來看,這些問題就不能忽視了。何況中文字的複雜性是另一個維度(dimension)的考量。

業界標準(de facto standard)「可攜式文件格式」(Portable Document Format , PDF)使文件的內容原貌重現或高逼真度的呈現不再是夢,原理是把文件的內容、版面資訊以及用到的字型等一併傳給對方,祇要接收端的設備(如螢幕、印表機、音效卡等)功能與發送端相當,而且有符合PDF規格的閱覽器(reader),就可以看到原貌重現或高逼真度的呈現。

接收端閱覽可攜式文件時不需要多國語文的支援,完全自給自足。但是,用PDF表達的文件無法加註內容標示,因此,人工方式還可作有限的再使用,電腦化的再使用就有很大的困難。

國內已有兩個以PDF為基礎的產品可供製作及瀏覽可攜式文件:一為華康的DynaDoc,一為隸南的DocuCom。兩者的功能比較如表一。這些產品的重要考量是,用任何一家產品製成的可攜式文件,祇要別家的瀏覽器符合PDF規格就可以將之原貌重現。從表一中可知華康產生的文件並不完全符合PDF規格。表二對PDFHTML做了一個比較。

表一 可攜式文件產品比較表

產品名稱

電子文件通(DynaDoc)

文電通(DocuCom)

生產公司

華康

棣南

產品內容

產生器(Generator)

閱讀器(Reader/Plug-in/Pro)

搜尋器(Search)

拓坊(DocuMaker)

導讀(Reader & Plug-in)

廣譯(DocuPlus)

文件產生器差異

(Generator)

.已有Window 95

.有英、中、日、大陸版

.不同語文不同文件產生器

.不提供印表機驅動程式

.只有Window 95

.有英、中、日、韓、大陸版

.不同語文不同文件產生器

.提供視窗版標準PostScript印表機驅動程式

系統規格

仿Adobe Acrobat設計概念,但檔案內容、格式自訂,操作功能與Acrobat完全不相容

作業方式與功能比照Adobe Acrobat V3.0規範(除未公開之安全保密及使用權限部份),另加DBCS亞洲雙語文字集

字體嵌入方式

一定將字體嵌入WDL檔內

可選擇將字體直接嵌入、不嵌入或轉成圖型再嵌入PDF檔內

可攜式文件檔產生作業方式

.直接產生WDL文件檔

.每種平台或每部工作站要轉檔都需安裝該產品文件產生器

.直接產生PDF文件檔

.網路伺服器作業模式

.單檔逐次轉換模式

.透過「拓坊」可轉換MAC & UNIX平台產生之PostScript

壓縮方式

只有一種但方法不明

.文字、影像、解析度都可設定

.有DEFLATECCITT group 4RunLengthJPEG低品質、JPEG中低品質、JPEG中等品質、JPEG中高品質、JPEG高品質等八種方式

安全保密設定

只有開啟者安全保密設定

安全保密設定分為所有者與開啟者,對於列印、複製、頁面重組、輸入備註另設使用權

Acrobat reader 3.0測試檔案相容性

完全不相容

可開啟由「拓坊」產生之PDF(不設密碼及權限),原文重現並可複製及列印

可攜式文件編輯器檔案匯入/匯出功能

.可匯出備註/書簽/文串到檔案,頁面文字亦可到剪貼簿

.可匯入備註/書簽/文串/頁面

可攜式文件編輯器輸入之語文內碼

傳給其他非同語文系統會出現亂碼

可選擇字體嵌入功能,傳給其他非同語文系統不會出現亂碼

可攜式文件編輯器Hyper Link & Hyper Text

Hyper Link只可標示文字網頁,且點選後回不到原出發之reader

Hyper Text只可單句串連

Hyper Link可標示任何網站文字或圖像檔,點選後可回復到原出發之reader

.文串可串成文章閱讀順序

可攜式文件編輯器文件展示

.可編輯、設定頁面展示效果及自動換頁時間

.全頁面展示時可同PowerPoint之動態效果

.段落、名詞亦可設定展示效果

線上作業說明及操作手冊

線上作業說明仍為日文內碼,一般使用者無法閱讀

已有完整之線上操作說明及範例

查詢/檢索功能

Reader只可查詢文章文字

.另有Search Engine可跨檔搜尋字串

Reader只可查詢文章使用字體檔,轉成圖型則不可查詢

Search Engine暫名為「引得」預計87/3出版

錄放機(兩者定義用法不同)

只能播放原WDL檔內容,無動態效果

可在文章中插入錄放機,錄放機

.可連結電影、語音、PDF

視窗變化

微視窗內容只有直式排列,主微視窗不可變化

.書簽視窗可按章節組成樹狀結構,方便查閱與使用

.主微視窗可有多種排列方式

Reader Plug-in差異

.單獨程式

.支援IE & Netscape 2.0以上

.含於DocuReader

.支援IE 3 & Netscape 3以上

Reader差異

.不含Browser Plug-in功能

.可支援Window 3.1/95/NT

.含Browser Plug-in功能

Window 3.1版支援1.0功能

Window 95/NT版支援2.0功能

視窗OLE2.0功能

未知

支援

資料來源:棣南, 1997

表二 PDFHTML之比較

比較項目

PDF

HTML

適用作業

靜態式圖文資料交換 網際網路網頁設計應用

文件產生與應用程式之連結

任何作業平台及應用軟體,皆可由PostScript印表檔產生PDF檔案格式,且原貌重現

只有最新的應用軟體有提供靜態文件轉成HTML檔案格式,轉換後HTML設定會改變原文格式,變更文件需熟悉撰寫HTML語言者人工處理

生產差異

品質穩定、生產容易、快速且大量

品質不穩定、生產困難、耗時且量少

文件處理方式

以可攜式文件格式(PDF)儲存與顯示文件,可解決圖型、語文、字型、內碼、造字、軟體版本在不同視窗環境無法作業問題

HTML撰寫之文件,在不同視窗環境會受限於瀏覽器功能、版本、圖型、語文、字型、內碼、造字等影響,解決之方法只有以影像(image)處理,但檔案會很大

安全防護及使用權限(智慧財產權)

對文件擁有者及調閱者可設有密碼,文件列印、複製、編修及備註功能可設定使用權

對所有人都無安全防讙及使用權限(智慧財產權)之保障

整篇文章資料儲存方式

文件產生時圖文共有八種壓縮方式

圖文檔分開,文字檔不可壓縮,圖型按檔案結構壓縮

Browser上儲存、調閱檔案

只有一個PDF檔儲存,離線調閱容易

所有關連之圖文檔各別儲存,離線調閱較不方便

傳送時資料壓縮

儲存時已壓縮過,傳送時數據機會再壓縮

按數據機提供方式壓縮

閱讀方式

先下載PDF readerPlug-in功能程式,安裝後始能閱讀

直接使用Browser

資料顯示方式

PDF檔全部下載完始能顯示

可一邊下載一邊顯示

資料複製作業方式

下載完即可離線作業

須連線作業

Hyper Text

支援

支援

Hyper Link

支援但Browser中不能使用

支援

網頁視窗切割

不支援

支援

動態圖檔

不支援

V3.0後支援

走馬燈

不支援

V3.0後支援

背景圖案及音樂

不支援

V3.0後支援

字型大小

字型提供所有大小字皆可使用

HTML系統只提供六種

文件顯示差異

有頁的觀念,翻頁有動態變化

文件視為一頁,翻頁無變化

欄位輸入及檢核

Adobe Acrobat V3.0前及棣南文電通V2.01前不提供欄位輸入作業。E-FORM版始有欄位輸入功能,但檢核作業須由Host端程式處理

V2.0即訂欄位可輸入功能,Remote端可以Java Script檢核,Host可以JavaCGI程式檢核

文件編排、校閱

WYSIWYG(What You See Is What You Get)

撰寫後再以Browser測試效果

列印作業

直接列印,有頁的觀念

重新下載再列印,無頁的觀念

資料來源:棣南, 1997


Page 1 of 3
上一頁

回目錄

下一頁

文獻處理實驗室