行政院科技顧問組
委辦研究計劃 1998年2月
第十二章 可攜式文獻與中文資訊的共享 |
Page 2 of 3 |
貳、內容標示的考量精通中文的學者可能因為學術研究的需要而希望利用電腦對內容作全文檢索或再利用(reuse)。對這類使用者而言,電腦能夠自動處理內容比原貌重現給人看更重要。因此應把內容格式和版面格式完全分開以利交換,內容也要加以適當的標示以利電腦處理及多元應用。
目前最受注目的文件標示語言應數Extensible Markup Language (XML),它可以說是取SGML之長,補HTML之短,從1996年底草案推出,短短一年已席捲全球,相關支援工具軟體如雨後春筍般的出現,連微軟公司都準備在Internet
Explorer 4.0版掛上(plug-in) XML文件的呈現器。
供電腦處理的內容若以XML標準來表達,則接收端祇要有XML剖析器且知道標示用的標籤語意(semantics),就可以交給各種應用程式使用。
XML的制訂者已考慮到Internet和WWW上的高效率文件交換,也兼顧了文件版面呈現,因為他們用XML定義了一個名為XSL (XML Style Language)的版面描述語言。如果在傳遞內容時也把它的版面資訊以XSL表達,一併送給對方,則接收端也可以將內容做某種逼真程度的呈現。 不過使用XML於中文內容時必須注意以下幾點:
|