行政院國家科學委員會研究計畫案 1999年11月8日 PART VI 附錄 |
Page 3 of 4 |
附錄三 中文Metadata的規劃與實作試驗探討 中央研究院Metadata工作小組第一、二階段報告 陳亞寧 江惠英 陳淑君 劉嘉慧 壹、中央研究院Metadata工作小組的成立與任務 Metadata工作小組於民國八十七年八月成立,目的在於針對院內進行中,或即將進行的數位典藏計畫著手探討適合中央研究院博物館、圖書館及檔案館等單位典藏資料的資訊描述格式與元素(format and element),以及檢索等相關事宜。依文獻及各研究計畫現況報導,國際間針對博物館、圖書館及檔案館所研訂的Metadata著錄格式雖有CIMI(Computer Interchange of Museum Information)、CDWA(Categories for the Description of Works of Art)、EAD(Encoding Archival Description)、FGDC(Federal Geographic Data Committee)及DC(Dublin Core)等二十餘種,然而這些著錄格式為求完整化、標準化及國際化等目標,目前仍屬持續研修階段,未臻完成。就現況研究需求與資料內涵而言,因本院館藏資料特殊,似乎沒有一種標準與著錄格式能完全滿足院內現有典藏資料特質的需求。加上Metadata議題的發展在國內外仍處於探索階段,工作小組採取對既有文獻及現有Metadata標準與格式進行研析,並掌握世界各項Metadata相關研究計畫發展現況,進而評估、分析,期能建構一套適用於中央研究院多元化及臺灣本土化典藏特質的Metadata 格式與元素。更甚一步,能兼容並蓄所有傳統媒體及由傳統媒體轉為數位典藏等兩部份的資訊內涵。 因此,工作小組主要任務有三:
貳、研究方法與範圍 工作小組係以印刷等傳統媒體及由傳統媒體轉為數位典藏為主要對象,準備規劃以下列方式、程序進行Metadata 格式之研究與設計。
蒐集Metadata主題相關的文獻,由工作小組成員分別鑽研各種 Metadata 格式,並給予簡報。目前已進行八種Metadata相關範疇, 包括:基本概念導覽,廣為使用的Metadata(DC), 政府機構文獻的GILS( Government Information Locator Service),如博物館與檔案館相關的Metadata(如CIMI,CDWA,EAD)及整合各式Metadata的基本架構(如Warwick Framework,RDF( Resource Description Framework))。這些歷次的研讀心得將陸續於〈計算中心通訊〉中予以刊載,讓有興趣或關心Metadata應用於數位典藏資源的同道一起分享。 中央研究院各所研究人員為了學術資料使用的方便性,早已建置符合本身需求的資料庫系統。無論是紙本、卡片式或是電腦型式,工作小組成員先行了解現有系統運作方式及其優缺點,作為設計Metadata格式及系統需求的參考。 實際與中央研究院使用者及資料管理者進行晤談與溝通,以深入了解並確定雙方需求,同時經由資訊科技人員的參與,作為研擬Metadata的主要參考依據。目前中央研究院在「國科會數位博物館專案計畫」中參與三項學科主題計畫,包括:臺灣原住民-平埔族群、不朽的殿堂-漢代的墓葬和文化、臺灣的本土植物和魚類。經由每週的定期會議,分別邀請計畫相關成員齊聚一堂,溝通、確認要求,並收集所有相關的資料屬性,讓Metadata工作小組成員更了解其所要表達的資料內涵和深廣程度。 中央研究院為國內最高學術研究單位,在執行「國科會數位博物館專案計畫」之際,為能將豐富的學術資源呈現於網路上,以達到社會教育化的功能,因此對於既有的建檔資料與格式,必須參照國際標準加以規範制定。 工作小組以「臺灣原住民-平埔族群」計畫為首例,進行資料內涵的分析及屬性的確認,並模擬設計出Metadata輸入表單。經公開解說後,請該計畫的相關學科專家詳實確認、試填、實作,以及提出修正意見。
為使Metadata的規劃作業更臻完善,工作小組成員目前已出席參與兩項國際Metadata相關會議及研討會:「1999 PNC (Pacific Neighborhood Consortium) Joint Meeting」、「Workshop on Dublin Core for Museums,數位博物館資訊組織研討會」。
參、Metadata設計的目的導向 工作小組針對中央研究院數位典藏計畫的內涵進行分析,對Metadata設計的主要目的有八項:
肆、Metadata設計原則 基於中央研究院典藏資料及文物的調查和研析,為能建構一套兼容台灣本土典藏的特質,又能兼顧中央研究院學術研究需求的功能,最後並能符合網路資源的國際化,工作小組乃訂定以下八項原則,作為規劃中央研究院Metadata之依據。
伍、Metadata的設計架構 工作小組期望設計 Metadata的原則係本著使用容易、詮釋深入為目標。因此在設計架構上希望達到如下的特色:
陸、Metadata記錄架構及輸入表單(template)設計 基於前節預期設計達成的特色,有關Metadata記錄結構與輸入表單方面,分述如下:
基本上分為核心元素(core element)及從屬元素(individual element)兩種層次,所謂核心元素乃是不同Metadata 格式間所共通、共用的資料欄位,而從屬元素則是各式Metadata格式所獨有的資料欄位。但是一個完整的Metadata 格式是由核心及從屬元素共同組成,如圖一所示。
柒、研究發現與建議 發現1 Metadata評選原則與要點 目前全球已有各式Metadata 格式,但是中央研究院在設計適合本院需求的Metadata時,仍不宜貿然採取「從無到有」的自行研發方式,應以採用「現有標準」為首要原則再進行修改。Metadata工作小組成員係以了解各種Metadata 格式為切入點,再依據對院內現有數位典藏計畫資料內涵進行研析,提出下列要點(criteria)作為評選Metadata的參考依據。評選要點如下:
發現2 Metadata記錄架構初步證實可行 工作小組所設計的Metadata架構經以臺灣原住民-平埔族群計畫中的相關資料實作後,初步發現可行性相當高,但由於目前院內尚有其他兩項主題計畫(臺灣的本土植物和魚類、漢代的墓葬和文化),可能涵蓋的資料類型與特質會有不同。因此,更詳盡深入地了解這兩類型的資料特性以及臺灣原住民-平埔族群計畫的其他資料特性(如,聚落資料),將可更詳實確認架構的可行性。 發現3 Metadata設計及執行之效率問題 工作小組在設計輸入系統介面(input editor)時係以呈現出不同主題的特有語彙為導向,讓學科專家在熟悉的環境中建立Metadata,因此不同資料類型可能需有不同的輸入表單與欄位名稱。例如:專書、單篇文章、古文契書、地圖資料等。同時為顧及每一種資料類型的獨特性而為之量身訂做,在建置的效率上是一大考驗,因此適當地整合會是一個重要的工作要點。 建議: 下階段的工作重點,工作小組將建議除持續與學科專家(content experts)晤談、溝通外,Metadata權威控制的建立當屬首要之急,期使Metadata的呈現更具質感,資料能夠更精確地被記載、詮釋與串聯;例如人名權威檔、地名權威檔等。另一方面,如何更有效率地進行Metadata的建置作業亦是需要改善之處。最後,以系統建立的角度而言,資料間之互動模式也是極待發展與建立的重要工作。 ★Metadata 記錄展現:以平埔族計畫之古文契書為例
表一:古文契書記錄實例
表二:Metadata記錄元素、欄位名稱、其他Metadata對照表 |