文獻處理實驗室 論文目錄

當前語文問題學術研討會 (國立台灣大學文學院主辦) 1994626

語文工作與資訊發展──

從電子文件的發展談對語文研究的期盼

Page 1 of 4

謝清俊

壹、前言

一、與世界對話

1994年6月10日至12日,中央大學中國文學系主辦的『與世界對話──甲戍年世界紅學會議』有項創舉:會中所發表的四十四篇論文全都放在學術網路上。誠如主辦單位宣稱,此舉「突破了會埸空間的限制」,使得沒有到達現埸與會的人士,無論在世界那個角落,隨時可以透過電腦網路看到所有的論文,也可以把想要的論文列印下來,或者乾脆把全部會議的議程、參與人員名單、以及論文等電子檔案抄錄在小小一片磁片中以備後用。這是電子文件展現的魅力。

其實,電子文件的魅力尚不止於此。例如:主辦單位不需勞民傷財地印製論文集,而電子形式的論文集,卻可無窮無盡地供應給任何一位真正需要它的人。又如,電子文件和資訊技術的運用,改變了傳統學術會議的溝通方式,使參與會議的員額幾乎無所限制、降低了會中發問討論的約束、省下了差旅、食宿、交通……等事務。這些方便之處,幾可任憑想像難以盡舉。如果說它能改變了傳統的知識傳播和分配的形態,也不過份。

此外,在發表的論文方面,有利用計算機對紅樓夢的內容作計量分析者,歸納出許多有趣的發現;有利用計算機作內容檢索者;有利用超文件( hyper-text)和多媒體(multi-media)技術製作綜合性的電子紅樓夢系統者。這些事實說明了中文電子文件的環境業已越來越成熟。【註一

二、由來同一夢

用計算機處理浩瀚的文獻一事,一直是人類的夢想。早在1960年代就有利用計算機處理法律和新聞檔案之事。然而,要能充份利用計算機來處理文獻,有其客觀條件。首先,文獻的數量是一個大負擔,計算機的儲存資料空間和處理資料速度若未達到能夠應付大量文獻的水準,那麼一切免談。其次,計算機若是沒有累積相當的語言文字處理能力來做文件表達、檢索和查詢的工作,那麼,也只能望文興歎了。此外,文獻索引和擷取的技術,各行業使用文獻的專業要求,使用人和機器間溝通的問題,以及文件共享和傳輸機制之建立等等,無一不是必須克服的障礙。再者,計算機對各種媒體的處理能力,如圖表、影像、語音之類,亦與電子文件的發展有增益的關係。 

1980 年,上述的各種困難均經研究而獲紓解。從1983年開始,市面上陸續出現了全文資料庫,正式啟開了計算機普遍地處理大量文獻的紀元。能有這樣的成就,在此之前廿多年計算語言學的研究是幕後最大功臣。

過去十年中的發展更是一日千里。目前,計算機的功能和價格已經不再是問題。電腦網路、主從(client/server)式的資料伺服結構、超文件、多媒體、光碟、視窗、智慧型資料庫、智慧型人機介面、文件表達的標準……琳瑯滿目的發展,造成了近年來電子文件大量出爐的盛況,僅從出版的各種光碟文獻來看,就已令人目不暇給而歎嘆為觀止了。

電子文件(Electronic Document )簡單地說,即是以電子媒體所表達的文件。較之於書本,似乎僅是媒體之改變,然而其影響之廣大深遠,遠比畢昇活字版印刷技術之發明,實有過之而無不及。它是目前「資訊發展」中重要之主流,對人文、社會、乃至於整個文化的發展關係至鉅。電子文件之所以能如此發展,除了靠電子媒體特殊的性質之外,實多有倚重「語文工作」基本研究之支持。此間關係即本文所欲申述之重點。

然而,電子文件究竟有多大的影響力呢?電子文件的發展和語文研究工作究竟有怎麼樣的關係呢?要說明白這些事情的緣由,且讓我們在下文中從電子文件的基本性質談起。


 【註一】請參閱該會議中:王三慶、彭昆侖、陳郁夫、施鐵民、羅鳳珠與朱四明等各位之論文。


Page 1 of 4
上一頁

論文目錄

下一頁

文獻處理實驗室