親愛的使用者您好: 首先感謝您曾下載漢字構形資料庫。 漢字構形資料庫的研發由來已久,最早可回溯到1972年交通大學關於「交大字根系統」一系列的論文和報告。1993年,中研院資訊所文獻處理實驗室沿用交大字根系統的方法重新再做一遍,並在過程中作若干的改進。這段工作最大的工程,就是建立了漢字構形資料庫。 漢字構形資料庫的研發,至今已滿十四年。這十四年來,隨著微軟作業系統的不斷改版,我們也分別推出Windows 3.1/95/98/Me/2000/XP的版本,目前Vista的版本則仍在研發中。早期由於網路不普及,每當參加會議發表論文,我們常分送試用磁片或光碟;隨著網際網路逐漸普及,自2002年10月起,使用者已可上網下載漢字構形資料庫。漢字構形資料庫的下載人次,早期約一天兩次;隨著資料庫日愈完備,目前一天約為十次。這五年多來,至今下載人次達9,600次。 1998年8月,我們推出漢字構形資料庫1.0版。1.0版的研發歷經了五年,這個版本完整收錄五大碼13,051個字的字形結構,並開發部件檢字的功能。2.0版則在2002年7月推出,是我們第一個收錄古漢字的版本。最近的版本則為2007年12月推出的2.51版, 2.51版收錄古今漢字115,197個,其中楷書字形62,671個,小篆及重文11,100個,金文20,091個,楚系簡帛文字19,138個,甲骨文及重文2,197個;另收《漢語大字典》異體字表12,208組。 漢字構形資料庫目前主要的應用在於解決缺字問題,而其長期的目標則是解決文字學數位化的問題。現在,我們正準備研發漢字構形資料庫3.0版,這將是歷年來最大的改版。3.0版最大的特色是中文字碼改用Unicode,並可同時適用於Windows的繁簡體字版本。改換中文字碼是項大工程,我們也趁此機會全面翻修漢字構形資料庫,若您對目前漢字構形資料庫的使用或電腦缺字問題,有任何意見,歡迎您來信提出,以作為開發3.0版的參考,謝謝!
中研院資訊所文獻處理實驗室的缺字處理信箱:cdpservice@iis.sinica.edu.tw 漢字構形資料庫下載頁面:http://www.sinica.edu.tw/~cdp/cdphanzi/ 中研院資訊所缺字處理計畫首頁:http://www.sinica.edu.tw/~cdp/service/
中研院資訊所文獻處理實驗室 敬上
|
|
Email :cdpservice@iis.sinica.edu.tw
|