文獻處理實驗室 專案計畫

行政院科技顧問組 委辦研究計劃 1998年2月

第十二章 可攜式文獻與中文資訊的共享

Page 3 of 3

參、對中文資訊共享作法的建議

開放環境中的中文資訊共享要靠標準或規範,如:

  • 網路傳輸標準
  • 多國語文交換碼
  • 內容結構的標示語言(如XML)
  • 版面描述的標示語言(如XSL, PDF)
  • 缺字處理的規範

遵行標準更有賴軟體工具的支援,如:

  • 內容產生器
  • 剖析器
  • 瀏覽器
  • 應用程式

中文資訊在網路上共享要滿足這麼多先決條件絕不是輕而易舉的事,唯有在基礎架構(infrastructure)方面下功夫,使多國語文交換碼和多國語文輸入機制成為平台環境中的一部份,並提供合適的軟體工具,其上的內容製作和共享才能事半功倍。

根據前面的討論,中文內容依使用的性質可分為兩大類:第一類講求原貌重現,但對全文檢索或多元應用的要求不高,如中文教學和文化傳播。第二類不講求原貌重現,但對全文檢索和多元應用的要求非常高,如學術研究。針對這兩類不同的需求,治標的作法是:

  • 對第一類的內容,使用PDF標準,並以I-CARE和DocuCom為參考指標,替中文網路教學系統開發合用的教材。
  • 對第二類的內容,建議使用XML和XSL標準,並將上網的內容分為幾類,替每一類訂定DTD和style sheet,連同內容供人使用。

不過,這樣做等於把同樣的內容根據不同的使用需求產生兩種不同的表達方式(representation),這樣對施與受兩方都不是很有效率的作法。何況,介乎這兩個極端的需求佔大多數,如何滿足這些使用者,將是很大的挑戰。我們必須突破目前在技術上和標準上的限制,把這兩種表達方式整合,才能真正擴大中文網路教學系統的效益。

由於XML的進展一日千里,建議以XML為主體,注入PDF的優點,同時密切注意XML的走勢,甚至參與XML標準的制定工作,以確保中文的特殊需求不被忽視。

在中文網路教學系統中可以架設一個資源共享伺服器,把一些中文工具軟體放在上面免費供人使用,同時採用謝清俊的缺字處理機制,利用資源共享伺服器進行全球性的中文缺字管理。

參考文獻

  1. 【全錄與華康科技,1997】全錄與華康科技,〈可攜式文件入門DynaDoc〉,(1997)。

  2. 【楊迺仁,1997】楊迺仁,〈誰說PDF沒有中文化:棣南文電通-DocuCom〉,資訊生活雜誌,37,(1997)。

  3. 【康毅系統整合公司】康毅系統整合公司,「解決電子文件交換的最佳利器:可攜式電子文件」。

  4. 【Adams,1995】Adams, R. J., 〈Electronic Libraries SGML Applications : Background to Project ELSA. Program〉, 《Automated Library and Information Systems》, 29(4), ( October 1995 ) : 397-406.

  5. 【Alschuler, 1996】Alschuler, L., 〈From SGML to SyBook : How Sybase Puts 50,000 Pages Online [Report from the Edge].〉, 《Seybold Report on Internet Publishing 》, 1(1), ( September 1996 ) : 17-21.

  6. 【Bauwens, 1996】Bauwens, Bart, 〈SGML as an enabling technology for access to digital information by print disabled readers.〉, 《Computer Standards & Interfaces.》, 18(1), Jan 1996, : P 55-69.

  7. 【Chang, 1997】Chang, Ifay, 〈Pedagogics of I-CARE〉, 《Polytechnic Research Institute for Development & Enterprise》, Polytechnic University., (http://140.92.11.157/icare/General/icarefl.html)

  8. 【DeRose, 1997】DeRose, S., 《The SGML FAQ Book: Understanding the Foundation of HTML and XML.》, (Dordrecht: Kluwer Academic Publishers : 1997.)

  9. 【Kumpf, 1996】Kumpf, D. , 〈Re-engineering Your Company's Knowledge Infrastructure: Standard Tools vs. Standard Data Representations.〉, 《SGML '96 Conference Proceedings.》, ( Boston, MA, November 18-21, 1996 ) : 501-506.

  10. 【Light, et al. , 1997】Light, R. et al. , 《Presenting XML.》, ( Indianapolis, IN : SAMS.NET [Sams Publishing, Macmillan Publishing USA], 1997 ).

  11. 【Miller, 1994】Miller, C. , 〈Transborder Tips and Traps.〉, 《Byte》, ( June 1994 ) : 93-102.

  12. 【Mudawwar, 1997】Mudawwar, M. , 〈Multicode: A truly multilingual approach to text encoding.〉, 《Computer.》, 30 ( 4 ) , ( Apr 1997 ) : 37-43.

  13. 【Newcomb, 1995】Newcomb, S.R. , 〈Multimedia interchange using SGML/HyTime.〉, 《IEEE Multimedia ( USA ) 》, 2 ( 3 ) , ( Fall 1995 ).

  14. 【Oudet, 1997】Oudet, B. , 〈Multiligualism on the Internet〉, 《Scientific American》, ( March 1997 ): 77-78.

  15. 【Poullet, 1997】Poullet, L. , 〈Semantic structuring of documents.〉, 《Proceedings of the Third Basque International Workshop on Information Technology – BIWIT ’97 – Data Management Systems.》( 1997) : 118-24.

  16. 【Reinfelds, and Kaugars , 1994】Reinfelds, J. and Kaugars K. , 〈Visualization and transformation of SGML knowledge representation structures. 〉, 《SEKE ’94 The 6th International Conference on Software Engineering and Knowledge Engineering》, ( 1994 ) : 330-5.

  17. 【Sakaguchi, 1995】Sakaguchi, T., 〈Browsing tool for multi-lingual documents for users without multi-lingual fonts.〉, 《Proceedings of the ACM International Conference on Digital Libraries 1996.》, (New York : ACM, ,1995 ) : 63-71.

  18. 【Sakamura, 1995】Sakamura, K., 〈Multilingual computing as a global communications Infrastructure.〉, 《Proceedings - TRON Project Symposium ( International ) 1995. 》, ( Los Alamitos : IEEE, 1995 ) : 2-14.

  19. 【Sugimoto, 1996】Sugimoto, S. , 〈Component technologies and environment for digital libraries.〉, 《Joho Shori ( Japan ).》, 37 ( 9 ), ( Sept. 1996 ) : 820-5.

  20. 【1995】〈The American Poetry Full-Text Database [News and Notes].〉, 《Literary and Linguistic Computing》, 10( 4 ) , ( November 1995 ) : 318.


Page 3 of 3
上一頁

回目錄

下一頁

文獻處理實驗室