通用科学数据管理软件平台的元数据采用开源软件平台进行数据仓储与数据管理,是图书馆开展科学数据仓储建设较为普遍的方法。Dspace和Fedora采用DC元数据作为其元数据标准。图书馆在参与科学数据管理实践的过程中,随着工作内容的深入,其元数据实践也从基本的元数据标准与元素推荐,拓展到面向科学数据管理各流程的元数据整体方案的设计与实施。......
2023-11-22
在科学数据的组织、管理和共享等工作中,良好的科学元数据描述框架对于保证科学数据有序组织和深入揭示,确保不同科学数据仓储之间资源描述的一致性和互操作性等都具有至关重要的作用,能够为不同资源系统之间的互操作、资源整合、跨库检索等奠定基础。
(1)科学元数据描述框架的研究和实践
当前研究与实践领域均着重开展元数据内容标准的研究、制定与实践,而对科学元数据描述框架的研究和实践相对较少,主要集中于科学元数据描述框架的功能需求、科学元数据描述框架的实践探索以及其与科学元数据标准的关系等方面。元数据描述框架相比元数据内容标准,其承担的指导性和框架性作用更强,不局限于特定领域的术语系统限制[4]。科学元数据描述框架多对特定学科领域或数据仓储的专门元数据内容标准具有框架性的指导作用,从较高的层面实现科学元数据内容标准之间的协调和互操作。英国中央实验室研究理事会(The Council for the Central Laboratory of the Research Council,CCLRC)为实现试验信息以及“结构性科学”产出数据的组织,研发了核心科学元数据模型(the Core Scientific MetaData Model,CSMD),从而方便以统一的形式实现科学数据的组织和获取[5]。此外,对元数据标准功能需求的调查分析对元数据标准和描述框架的设计与实施都具有重要的指导作用。Hong Huang等针对基因数据管理中的元数据功能需求,对156名基因领域科研人员进行调查,发现科研人员对元数据的功能需求包括简便易用性、可复用性、可操作性、充分性、交互性和模块性,针对跨平台和跨库数据对比、集成和复用等工作,基因领域科研人员对元数据持有独立性和非独立性两种类型的功能需求[6]。Craig Willis等认为,科学元数据内容标准应当符合两个条件,即描述对象必须只针对科学数据集而非广义的科学信息;必须运用于科学数据仓储。以此为基础,从现有的50余种科学元数据内容标准中筛选出9种进行科学元数据标准的目标需求调查,发现不受学科领域限制的元数据目标包括可扩展性、弹性、模块化和可移植性等,而指向数据仓储同时不受学科领域限制的包括支持数据的记录、交换、检索和存档等功能需求,在综合性、充分性、简易性和抽象性等方面则具有不同的目标和需求[7]。
(2)元数据在科学数据共享中的应用
科学数据共享一直以来都是科学研究领域极为重视的问题,而元数据是数据共享的重要技术手段和实现途径。随着科学数据共享的备受关注以及不同学科领域、地域范围的科学数据共享项目纷纷启动,科学元数据标准建设成为关键性的工作内容。2013年,网络与信息技术研究与发展(The Networking and Information Technology Research and Development,NITRD)项目针对科学数据共享及相关元数据领域的问题与策略进行了详细的探讨[8]。当前科学数据共享的实践和研究多集中在特定的学科领域,因此特定学科领域的元数据标准的研究和实践最为突出。Tschangho John Kim以地理空间数据共享为切入口,认为元数据可以实现科学数据的获取、利用和转化等需求,对现有的地理空间领域的8种元数据内容标准的结构进行比较,以期建立更加简化和适用于数据共享的地理空间领域科学元数据标准[9]。Craig Willis等通过分析科学数据标准之间的相同和不同之处,探讨了科学数据共享面临的元数据方面的阻碍[10]。国内学者如诸云强[11],袁雪梅[12],李雪山[13],杨青军[14]等分别针对地球科学、海洋科学、交通、气象等学科领域的科学数据共享系统或平台建设中的元数据设计与实现问题进行了详细研究。国内外众多学者针对特定学科领域科学数据组织实践现状以及科学数据系统的现状,开展科学元数据内容标准的需求分析,并探索适用于科学数据共享的元数据解决方案。
(3)科学元数据的相关技术研究
解决元数据在科学数据各项管理的应用中存在的众多技术问题是科学元数据应用的重要环节。都柏林核心元数据倡议(Dublin Core Metadata Initiative,DCMI)下属的科学与元数据社群(DCMI Science and Metadata Community)针对科学元数据的识别体系、标准、语义结构和模型、可交互的取值系统、元数据链接机制等技术问题开展了研究和探讨[15]。国内外学者关注科学元数据标准的元素拓展、语义结构体系建设以及科学元数据标准之间的互操作问题等。Anneke Zuiderwijk等探讨了元数据在促进关联开放数据出版和使用方面的潜在价值,包括提高数据的关联、可视化以及数据质量的评估等[16];Bill Howe等将以RDF为基础的数据模型融入科学元数据建设和生成,从而简化数据生产者的工作并提高数据的语义检索功能[17];Yolanda Gil等将语义技术、Wiki技术、关联数据的理念与科学元数据结合,为科学数据集、科学家、科研项目和存储位置四个主体分别设立独立的识别机制,并建立四者之间的关联[18];Jian Qin等尝试运用RDF三元组和关联性的URI标识等与生态元数据(Ecological Metadata Language,EML)的记录进行关联,从而将生态学领域科学数据以关联性的语义网络形式加以呈现[19];Miao Chen尝试基于现有XML格式元数据和地理学科领域数据特征的本体来实现对地理数据的语义化描述和组织[20];徐维等以临床医学数据标准为基础,构架了临床研究元数据的宏观框架、中观类组和微观属性三个层次的元数据语义架构体系[21]。(www.chuimin.cn)
(4)特定学科领域和科学数据项目中的元数据研究与实践
从其描述对象的学科领域进行划分,现有的科学元数据标准可分为综合性科学元数据和学科性科学元数据,在DCC统计的科学元数据标准中[22],77%的科学元数据标准为特定学科领域元数据标准或指向统计、行为描述等特定领域的元数据,而综合性科学元数据所占比例相对较少。Craig Willis等通过调查发现当前学科领域科学数据较为丰富,存在重复建设的现象[23]。科学元数据标准的建设多为学科性元数据且多针对特定的系统和项目进行建设,这主要是缘于现有的元数据标准多围绕特定的项目或数据仓储建设,其适用范围受到限制,而都柏林核心元数据(Dublin Core,DC)等较为通用的元数据标准虽然在科学数据的描述和组织方面也有所尝试,但DC其设计和运用更适用于图书馆领域传统馆藏文献与数字化文献的描述和组织,从而形成了元数据标准建设多方参与且逐渐多元化的现状与趋势。
英国联合信息系统委员会(Joint Information Systems Committee,JISC)的出版者、仓储与机构元数据交换(Publisher,Repository and Institutional Metadata Exchange,PRIME)项目致力于实现出版者、学科库以及机构库之间的元数据自动交换[24]。欧盟“第七科技框架计划”(Seventh Framework Programme,FP7)的ESPAS项目将元数据作为基础设施的重要研究和建设对象,力求为集成元数据的发现、挖掘和可视化等提供增值服务[25];而FP7资助的CESSDA项目针对项目对元数据的功能需求,围绕科学元数据的互操作和元数据保存[26]、评价[27]等一系列元数据管理问题进行研究和实践。
(5)科学数据管理中的元数据应用
近年来,元数据在科学数据管理中的应用也逐渐成为研究的热点问题。2013年10月召开科学数据管理的元数据和仓储服务网络研讨会,对科学数据管理中的元数据问题进行了探讨[28]。Jian Qin等对元数据在支撑科学数据的发现和管理方面的功能与结构需求进行研究,总结了现有科学领域元数据模型、取值系统,提出最少努力、基础设施型服务和便携性等科学元数据模型的三个基本原则以及元数据在科学数据共享与管理中的功能和结构需求以及应用前景[29];Alison Chilvers认为元数据是普遍意义上科学数据管理的关键,并从数据交换和数据长期保存的角度探讨元数据在数据管理方面的作用[30]。随着科学数据管理的发展,元数据管理也成为重要的研究方向,如Gurmeet Singh等针对科学元数据的存储、获取和查询等问题以元数据目录服务(Metadata Catalog Service,MCS)为例,阐述了元数据管理系统的应用和相关研究[31];Matthew B.Jones等对科学元数据目录系统Metacat进行介绍,该系统提供了可扩展的、模型化的元数据管理框架,整合RDF的技术和方法,允许科研人员存储、管理和检索XML格式的元数据记录[32]。Tiffany C.Chao通过对当前科学元数据标准的分析,探索研究方法的描述方式,进而分析科学数据管理、长期保存、共享以及再利用等对元数据标准的需求[33]。
科学元数据被广泛应用在科学数据共享平台搭建、科学数据管理、科学数据仓储建设等领域,当前研究多从元数据的元素拓展、技术完善、互操作等微观方面以及元数据在科学数据各项管理工作的实例应用角度进行研究,缺乏综合性的针对科学元数据描述框架的研究。
有关科学数据管理与共享的理论与实践的文章
通用科学数据管理软件平台的元数据采用开源软件平台进行数据仓储与数据管理,是图书馆开展科学数据仓储建设较为普遍的方法。Dspace和Fedora采用DC元数据作为其元数据标准。图书馆在参与科学数据管理实践的过程中,随着工作内容的深入,其元数据实践也从基本的元数据标准与元素推荐,拓展到面向科学数据管理各流程的元数据整体方案的设计与实施。......
2023-11-22
PURR针对科学数据的描述、管理与保存的需求,在对现有元数据标准进行综合考虑与评估的基础之上选择合适的元数据标准形成了一套针对科学数据的元数据实施方案。多数描述元数据元素通过作者在提交数据时填写的在线表单获取,由馆员对提交信息的正确性进行检查,进行确认后,生成的元数据记录保存在PURR的数据库中。......
2023-11-22
天文、地理、生物、医学等领域的科学数据管理自然科学领域研究中涵盖大量的实验和数据,一直存在大量的科学数据管理需求。人文社会学科领域的科学数据管理当前,人文社会科学数据的组织、管理也逐渐成为科学界研究的新焦点。......
2023-11-22
众多专门旨在科学数据管理相关工作和研究的专门机构,都将元数据作为重要的研究和实践内容。该工作小组自成立以来,为保证科学数据共享对元数据的基本需求,在元数据对科学数据共享的重要性的宣传,受控词表的推荐,元数据的收割、解释与映射等方面开展了研究与实践[69]。......
2023-11-22
元数据是科学数据管理的重要工具,通过元数据的描述和组织可以实现科学数据有序化地存储、获取和再利用。元数据成为科学数据管理实践和研究中广为关注的问题。2012年NISO和DCMI联合召开了主题为“科学数据研究管理的元数据”的网络研讨会,以科学数据的保存、共享、复用等工作所需处理的元数据问题进行了讨论与研究[59]。元数据在科学数据管理中的角色定位被认可,而其在科学数据管理实践中的应用不断夯实并得以拓展。......
2023-11-22
科学元数据的描述框架基本由元数据标准、取值系统、概念/数据模型、编码系统和适应特定系统的内容标准即应用文档组成。图5-1科学元数据描述框架①元数据内容标准。科学元数据标准的元素设定为科学数据的描述方面奠定基础。科学元数据标准根据其元素功能可划分为不同的类型。......
2023-11-22
因而多数图书馆在提供科学数据管理计划协助起草的服务中,明确提出协助科研人员和科研团队选择恰当的科学数据元数据标准,以保证科学数据的有序化、标准化的组织。由此可见,在科学数据管理中,图书馆开展的元数据实践以科学数据相关的元数据内容标准和相关元素的选择与推荐为最主要的工作内容,开展元数据描述与组织工作的具体实施的图书馆较少。可见,元数据已成为科学数据馆员的必备技能。......
2023-11-22
e-Science环境下,科学数据呈指数级增长,图书馆在发挥其科学数据保存和服务方面具有不可替代的地位和作用。麻省理工学院图书馆的HMI项目实现了对地理学科数据管理的MIT地理数据知识库的数据创建及管理[64]。科学数据管理服务中的合作机制国外图书馆在开展科学数据管理服务时大多采取合作机制,强调学科馆员与科研人员的密切合作。......
2023-11-22
相关推荐