文獻處理實驗室 論文目錄

第三屆中國文字學國際學術研討會 1992年3月21-22日

廿五史的文字統計與分析

Page 1 of 1

謝清俊、林晰、許金定、傅武嫦、張翠玲

摘要

本計劃是利用業已完成的廿五史全文資料庫所做的基礎文字統計工作,其目的是多重的,希望藉此工作能夠:

  • 多了解一些國語文的性質。
  • 發展出全文資料庫能共用的統計軟體。
  • 建立語文統計分析之能力以援各種語文之應用。
本文內容: 

壹、語文處理的基礎工程
貳、漢語文字統計之回顧
參、研究計劃簡介 
一、資料背景
二、廿五史全文資料庫的環境及統計功能
三、異體字與符號之整理
肆、統計舉要
一、依體裁之統計
二、字頻統計
三、累頻與頻譜 
四、文件字數與其字集字數之關係
五、字集比對
伍、檢討、未來的工作與結語 

Page 1 of 1

論文目錄

文獻處理實驗室