文獻處理實驗室 論文目錄

中文全文文件
自動索引研究系統規劃

Page 1 of 1

黃雲龍、謝清俊、謝清佳

摘要

隨著電子文件時代的來臨,資訊的儲存、呈現、處理與交換的方式發生很大的變革。對於文件數位化以後的資料處理與應用,尤其是全文文件(full text document)的檢索,更需要研究如何善用資訊技術以協助使用者在浩瀚的資料空間裡取得文件。因此,自動化文件檢索系統(automatic document retrieval system)應運而生。本文首先回顧全文儲存及檢索系統的發展歷程,以及資訊檢索研究的議題。並以美國康乃爾大學的SMART 系統作為例證,說明其在資訊檢索相關研究上的貢獻與其系統的設計藍圖。最後根據三個原則:(1)中文語文特性;(2)運用現階段中文資訊處理研究與應用發展的技術,如中央研究院中文自動斷詞技術以及中文全文檢索系統(CTP);( 3)參考向量空間模型(Vector Space Model;簡稱VSM)理論與初期中文全文自動索引的實驗設計。依此規劃中文全文文件自動索引研究系統的雛形環境,提供日後中文資訊檢索研究環境的發展基礎。

關鍵字: 系統規劃、自動索引、資訊檢索、向量空間模型、VSM、SMART

Page 1 of 1

論文目錄

文獻處理實驗室