首页 理论教育科学数据管理与共享:元数据应用实践

科学数据管理与共享:元数据应用实践

【摘要】:通用科学数据管理软件平台的元数据采用开源软件平台进行数据仓储与数据管理,是图书馆开展科学数据仓储建设较为普遍的方法。Dspace和Fedora采用DC元数据作为其元数据标准。图书馆在参与科学数据管理实践的过程中,随着工作内容的深入,其元数据实践也从基本的元数据标准与元素推荐,拓展到面向科学数据管理各流程的元数据整体方案的设计与实施。

(1)公共数据仓储的元数据

处理公共数据仓储是除了自建数据仓储之外最主要的科学数据存储媒介。对于为进行机构库或数据仓储建设的图书馆而言,公共数据仓储是其参与科学数据管理的第三方,公共数据仓储的元数据方案就成为该图书馆开展科学数据管理元数据实践的基准。虽然部分图书馆为科研人员进行了学科领域元数据标准、元数据元素的推荐,但针对数据存储于第三方数据仓储的情况,以数据仓储的元数据标准为标准进行描述和组织,才能最高效率地实现数据的最终存储。如Dryad数据仓储为数据的存储和获取等设计了以DC元数据为主的元数据方案,同时提供简便的元数据生成服务,为科学数据存储提供了便利。

(2)通用科学数据管理软件平台的元数据

采用开源软件平台进行数据仓储与数据管理,是图书馆开展科学数据仓储建设较为普遍的方法。目前主要采用机构库构建软件与专门用于科学数据管理的系统软件两种方法。机构库构建软件有Dspace和Fedora等,英国爱丁堡大学数据共享中心采用Dspace作为数据平台基础软件,美国约翰霍普金斯大学的Data Conservancy以及英国牛津大学嵌入式机构数据管理服务(Embedding Institutional Data Curation Services In Research,EIDCSR)等则采用Fedora来构建共享平台[90]。Dspace和Fedora采用DC元数据作为其元数据标准。专门用于科学数据管理的系统软件有数据文档倡仪(Data Documentation Initiative,DDI)的元数据标准,如哈佛大学定量社会科学研究所(Institute for Quantitative Social Science,IQSS)与哈佛大学图书馆、档案馆、信息服务部门共同搭建的Dataverse、英国数据档案馆和挪威社会科学数据服务局共同开发的Nesstar专门科学数据管理软件。而Dataverse和Nesstar均采用DDI作为元数据标准。(www.chuimin.cn)

(3)合作项目中的元数据

针对科学数据的共享、交换、整合等需求,部分图书馆和科研机构开展了相关领域的合作项目,如新墨西哥大学图书馆主持的关注地球影像数据的地球数据观测网(Data Observation Network for Earth,DataONE)项目[91],约翰霍普金斯大学图书馆主持围绕天文学、地球科学生命科学和社会科学领域数据的保存、共享、发现和再利用项目Data Conservancy等[92]。在合作项目中,元数据的设计与实施以项目的功能需求和建设目标为依据。DataONE是联盟式的科学数据网络,建立在多样化的数据仓储基础之上,旨在实现地球与生命科学数据的保存和共享,因此其元数据工作的主要内容在于不同数据仓储之间元数据记录的互操作以及保存元数据的设计与实施。DataONE通过系统元数据(System Metadata)和特定编码系统的设计(Coordinating Nodes),实现对不同数据仓储之间的互操作和共享[93]。同时DataONE以PREMIS为基础,以METS、开放归档初始计划的对象复用和交换(Open Archives Initiative's Object Reuse and Exchange,OAI-ORE)、BagIt文档封装格式等作为封装的参考,形成了DataONE的保存元数据方案[94]

元数据在科学数据管理计划制定、数据仓储的设计与运作、科学数据的出版与共享等方面都发挥着重要的职能。图书馆在参与科学数据管理实践的过程中,随着工作内容的深入,其元数据实践也从基本的元数据标准与元素推荐,拓展到面向科学数据管理各流程的元数据整体方案的设计与实施。在未来发展中,图书馆应当更加重视科学数据管理中的数据组织、存储、获取、共享、保存等工作,其元数据实践也应从其科学数据管理的整体设计和工作流程出发,进行适应性的选择与规划,为本机构科学数据管理工作的良好发展奠定基础。