因而多数图书馆在提供科学数据管理计划协助起草的服务中,明确提出协助科研人员和科研团队选择恰当的科学数据元数据标准,以保证科学数据的有序化、标准化的组织。由此可见,在科学数据管理中,图书馆开展的元数据实践以科学数据相关的元数据内容标准和相关元素的选择与推荐为最主要的工作内容,开展元数据描述与组织工作的具体实施的图书馆较少。可见,元数据已成为科学数据馆员的必备技能。......
2023-11-22
对于参与科学数据管理的图书馆或其他机构来说,主要采取两种方式存储和保存科学数据:一是自建机构库、学科库或专门的科学数据库,提供科学数据的存储;二是选择与科学数据内容、学科或其他要求相契合的公共数据仓储。对于自建的机构库、学科库或科学数据库而言,其元数据的实施应考虑以下需求:所选择的系统软件如DSpace的系统需求、科学数据管理的目标需求以及科学数据本身的特点特别是学科属性等。
(1)DataStaR的元数据创新实践
为实现机构科学数据的管理并提供较为完整的系统服务,康奈尔大学图书馆以机构库为基础,构建了数据阶段型存储库(Data Staging Repository,DataStaR),由图书馆协助科研人员实现科学数据与元数据记录的长期保存和复用。DataStaR的元数据实践旨在不增加科研人员和图书馆员额外工作的前提下,支持科学数据的共享、出版。考虑到多学科科学数据的现状,DataStaR继承了多领域、学科的元数据标准,以满足不同学科领域研究人员的需求,弹性的元数据实践、便利的用户接口为大规模的数据共享、出版乃至元数据复用提供了可能[83]。在DataStaR中,只需键入或进行选择“数据集标题”“数据集拥有者”“元数据和数据获取许可”“出版物目标存储仓储”四个元数据元素,其他均可自动生成或默认。
DataStaR尝试对现有的元数据内容标准进行精简之后融入DataStaR系统中的本体集中,从而将离散的元数据标准融合在一起,方便数据提交者重复、组合使用元数据标准以生成元数据记录,无需重复键入信息。由于DataStaR融合了尽可能多样化的元数据内容标准,因此用户可以方便地生成符合不同元数据标准格式规定的元数据记录[84]。数据管理人员重视将语义网的原则和技术运用到其元数据实践中,以实现良好的互操作和机器处理[85]。在语义网技术的应用方面,DataStaR对Vitro进行了拓展,Vitro提供了可定制的系统前端,实现数据语义图表的检索和浏览,同时提供本体和实例的编辑接口[86]。
DataStaR的元数据实践融合了语义网技术,实现XML与OWL的交互,集成了基于网络的RDF图表编辑、通过语义映射将现有的元数据标准、关联数据等进行集成[87],从而在实现本机构科学数据管理的良好运作的基础上,实现了用户最小负担和与其他数据仓储的最大交互的目标。(www.chuimin.cn)
(2)PURR的元数据标准融合方案
普渡大学是通过机构库来实现科学数据管理的机构典型。普渡大学图书馆在HUBzero系统基础上搭建了普渡大学科研仓储(Purdue University Research Repository,PURR)系统,将数据管理转化为机构知识库内嵌的基于科研过程的数据管理流程模块,从而成为项目组的科研管理平台[88]。PURR针对科学数据的描述、管理与保存的需求,在对现有元数据标准进行综合考虑与评估的基础之上选择合适的元数据标准形成了一套针对科学数据的元数据实施方案。本着描述数据集、识别数据拥有者和获取条件、生成稳健的长期保存元数据的目的和原则,PURR采用元数据编码与转换标准(Metadata Encoding and Transmission Standard,METS)作为封装标准,以都柏林核心元数据(DCMI Metadata Terms)作为描述元数据,以元数据对象描述机制(Metadata Object Description Schema,MODS)对数据拥有者、获取权限等进行描述,以PREMIS作为其保存元数据标准,从而形成了面向数据生成、描述与组织、使用到长期保存的元数据描述框架。
PURR在描述元素方面以DC元数据元素为主,最终确定项目名称、项目别名、标题、大纲、摘要、作者、标签、授权和发布日期等元素。多数描述元数据元素通过作者在提交数据时填写的在线表单获取,由馆员对提交信息的正确性进行检查,进行确认后,生成的元数据记录保存在PURR的数据库中。数据保存和出版确认将触发存档信息包(Archival Information Package,AIP)创建工具,综合PREMIS保存元数据、MODS标准以及BagIT格式等,实现PURR元数据记录的封装与保存[89]。
DataStaR和PURR都是自建系统和平台以实现科学数据管理,但两者在元数据实践方面有所不同,DataStaR容纳尽可能多的元数据标准,以适应不同学科数据的需求,同时尝试应用语义网技术,而PURR则是通过选择较为普适性的描述元数据标准和适用于各种功能需求的管理性元数据,从而形成较为固定的元数据描述方案。
有关科学数据管理与共享的理论与实践的文章
因而多数图书馆在提供科学数据管理计划协助起草的服务中,明确提出协助科研人员和科研团队选择恰当的科学数据元数据标准,以保证科学数据的有序化、标准化的组织。由此可见,在科学数据管理中,图书馆开展的元数据实践以科学数据相关的元数据内容标准和相关元素的选择与推荐为最主要的工作内容,开展元数据描述与组织工作的具体实施的图书馆较少。可见,元数据已成为科学数据馆员的必备技能。......
2023-11-22
众多专门旨在科学数据管理相关工作和研究的专门机构,都将元数据作为重要的研究和实践内容。该工作小组自成立以来,为保证科学数据共享对元数据的基本需求,在元数据对科学数据共享的重要性的宣传,受控词表的推荐,元数据的收割、解释与映射等方面开展了研究与实践[69]。......
2023-11-22
通用科学数据管理软件平台的元数据采用开源软件平台进行数据仓储与数据管理,是图书馆开展科学数据仓储建设较为普遍的方法。Dspace和Fedora采用DC元数据作为其元数据标准。图书馆在参与科学数据管理实践的过程中,随着工作内容的深入,其元数据实践也从基本的元数据标准与元素推荐,拓展到面向科学数据管理各流程的元数据整体方案的设计与实施。......
2023-11-22
科学元数据的描述框架基本由元数据标准、取值系统、概念/数据模型、编码系统和适应特定系统的内容标准即应用文档组成。图5-1科学元数据描述框架①元数据内容标准。科学元数据标准的元素设定为科学数据的描述方面奠定基础。科学元数据标准根据其元素功能可划分为不同的类型。......
2023-11-22
评估结果的计算采用7.1.2节中“评估方法”可计算出每个科学数据共享平台绩效评估的评分结果。人才队伍是科学数据共享平台的关键因素之一,其下设有服务团队规模及人员素质2个三级指标。管理制度是科学数据共享平台高效运行的重要支撑,其下包括政策法规和机构设置2项三级指标。加权值最低的是国家材料环境腐蚀(老化)科学数据共享服务网,为0.4592,该平台仅有11个数据集。其中加权值最高的是地震科学数据共享中心,为1.1561。......
2023-11-22
随着科学数据共享的备受关注以及不同学科领域、地域范围的科学数据共享项目纷纷启动,科学元数据标准建设成为关键性的工作内容。当前科学数据共享的实践和研究多集中在特定的学科领域,因此特定学科领域的元数据标准的研究和实践最为突出。国内外学者关注科学元数据标准的元素拓展、语义结构体系建设以及科学元数据标准之间的互操作问题等。......
2023-11-22
元数据是科学数据管理的重要工具,通过元数据的描述和组织可以实现科学数据有序化地存储、获取和再利用。元数据成为科学数据管理实践和研究中广为关注的问题。2012年NISO和DCMI联合召开了主题为“科学数据研究管理的元数据”的网络研讨会,以科学数据的保存、共享、复用等工作所需处理的元数据问题进行了讨论与研究[59]。元数据在科学数据管理中的角色定位被认可,而其在科学数据管理实践中的应用不断夯实并得以拓展。......
2023-11-22
为了集成海量的、异构的、多形态的数据,首先要将它们的描述统一起来,这就引出了对集成数据的元数据描述和管理的要求。事实上,人们对元数据的理解和认识还存在不少争议,迄今尚未形成真正统一的元数据定义。与数据字典不同,数据仓库主要是将元数据进行分析处理。2)元数据分类元数据广泛存在的多形态导致到目前还没有形成一个统一的分类标准。......
2023-10-28
相关推荐