《UNESCO指南》将在国家与国际层面的决策和政策制定者中得到广泛应用。至2014年9月,WDC在全球共有89个数据中心,这些数据中心几乎涵盖了地球和日地关系科学的各个领域,每个数据中心承担了汇集某个领域的科研数据并承担向科技界开放和服务的任务。②所有将要共享的数据、元数据和资料都应在最短的时间内以最低的成本提供共享。此外,WDS于2011年9月在......
2023-11-22
期刊文献与科学数据关联服务的实现中使用的几种工具或媒介是实现该关联服务的关键点,也是关联服务的关键性实现方式。
(1)行文中的明文表达
部分文章包含的科学数据量较小,可通过附加材料的形式在行文中加以呈现,因此部分期刊通过行文中的明文表达,揭示文章支撑数据的存储位置。较为典型的如Biomed Central对期刊文章支撑数据的存储进行规定,要求在文章行文中对支撑数据予以专门描述和表达,并根据数据存储于开放数据仓储或者包含在文章中两种情况进行区别表达(见表5-4),但都提供了文章支撑数据的可链接性或可追溯性的线索。
表5-4 Biomed Central期刊支撑数据的文中表达方式
除行文中的明文表达之外,将较小数据量的科学数据作为附加材料(additional/supplementary files)的形式与期刊文献同时出版,成为许多期刊支持的期刊文献与科学数据相关联的方式之一。根据对医学领域高影响力的28种期刊样本的调查,科学数据作为附加材料形式提供的文章数量每两年翻一番(2003—2009年分别从10篇、22篇、55篇增长到100篇),但多数以图表形式呈现,而支持在线附加材料的期刊比例从2003年的32%增长到2009年的64%[142],而随着在线附加材料形式的广为接受,越来越多期刊支持文献附加科学,PARSE.Insight的调查结果显示超过九成的期刊接受附加材料,科学数据是最重要的资源种类之一[143]。
(2)唯一识别符的应用(www.chuimin.cn)
科学数据仓储通过特定的元数据设定或赋予科学数据集以特定的识别符,从而实现科学数据仓储中科学数据与科学期刊之间的关联。DOI成为众多期刊、数据仓储推广的科学数据识别符,同时也成为期刊文章与科学数据之间关联的重要实现途径。科学数据采用DOI识别,可以便捷地实现科学文献与科学数据之间的互访和互联,甚至可以实现对数据运动轨迹的跟踪[144]。Dryad数据仓储赋予科学数据集以特定且唯一的DOI,并通过URL格式的DOI给予科学数据集或科学数据文档以可追溯的地址。通过在出版的科学期刊文献中呈现此数据集的DOI,可实现读者对该支撑数据的追溯和获取[145]。除了广泛应用的DOI识别符之外,还有URL/URN/URI、Persistent Uniform Resource Locators(PURLs)、Extensible Resource Identifier(XRI)、Archival Resource Key(ARK)、Life Science Identifier(LSID)、Object Identifiers(OID)、Universally Unique Identifier(UUID)等识别符机制,在选择所采用的标识符时,多将唯一识别性、唯一定位性、可引用定位性、科学性等作为评估和考量的标准[146]。部分科学数据仓储采用了自我设定的唯一识别符或者索引符,但其作用都是实现科学数据的唯一识别和可追溯、可引用的功能,如当科学数据被存储在GSA Data Repository中时,被赋予唯一索引号(Key Number),该索引号被添加到打印版文章的脚注或者补充说明里,用以追溯存储在科学数据仓储中的科学数据[147]。
此外,部分相同或相似学科的科学数据仓储之间建立了相互的映射和关联关系,对某一科学数据仓储的科学数据集检索结果可映射到其他科学数据仓储中,如蛋白领域的科学数据仓储UniProt与GenBank、PDB等多个数据仓储之间可进行科学数据检索结果的相互映射[148]。科学数据仓储通过识别符进行互联,可有效实现不同科学数据仓储之间双向链接,同时针对未给予科学数据DOI识别的科学数据仓储的期刊文献的追溯提供更多可能性。
(3)以科学数据线索为内容的数据文章
科学数据期刊多出版专门针对科学数据的数据文章(Data Paper),通常只对科学数据的提名、日期、作者、摘要、永久识别符、存档资源的链接或者实验条件、设施、环境要求等元素进行描述,而不是以科学数据的详细分析为内容。通常,数据文章提供科学数据与期刊文献的双重线索,从而成为期刊文献与科学数据关联的媒介。此外,部分科学数据期刊实质是集成数据出版和存储的在线平台,如《生物多样性数据期刊》(Biodiversity Data Journal)是一个支持同行评审、开放存取的综合性在线平台,既出版研究型论文,又要求支撑数据(20MB以内)以附加材料的形式出版或者将科学数据存储在外部数据仓储中[149],从而实现了科学数据与期刊文献的有效关联,用以加速生物多样性相关数据的出版、传播和共享。
另外,针对科学数据出版以及与期刊文献关联的需求,新的尝试不断涌现。Scientific Data期刊采用新的内容类型“数据描述”(Data Descriptor)对科学数据集进行针对性描述,并通过对此类内容的索引,提供科学数据的广泛共享以及与期刊文献的关联。“数据描述”作为传统科研出版物的补充性内容,采用针对科学数据的同行评议,以保证科学数据的完整性和标准化程度。Scientific Data将建成一个可搜索的科学数据出版平台,同时积极寻求与相关出版商、数据仓储如Dryad、Figshare等之间的合作,从而以高质量、认证的科学数据实现开放、复用。Scientific Data并不是原始数据的存储方式,而是通过数据的描述信息的出版提供原始科学数据的分析以及追溯线索的提供。“数据描述”以“来源出版物”(Original Publication)的形式标明科学数据集与期刊文献之间的关联,并提供来源文献的URL链接,从而实现在线的一键式关联[150]。
有关科学数据管理与共享的理论与实践的文章
《UNESCO指南》将在国家与国际层面的决策和政策制定者中得到广泛应用。至2014年9月,WDC在全球共有89个数据中心,这些数据中心几乎涵盖了地球和日地关系科学的各个领域,每个数据中心承担了汇集某个领域的科研数据并承担向科技界开放和服务的任务。②所有将要共享的数据、元数据和资料都应在最短的时间内以最低的成本提供共享。此外,WDS于2011年9月在......
2023-11-22
与科学数据保存与共享的成本相比,数据保存与共享的成本更加难以识别和确认。基于效益分类的数据共享效益识别模型Beagrie等将数据保存与共享的效益划分为三个维度进行考察[32],见表7-12。因而,我们应全面考虑数据保存与共享所产生的成本。另一方面,相对于数据保存与共享的成本,数据共享所产生的效益较难以量化评估,但我们可以从用户通过数据共享带来的成本节省途径来进行识别和量化。......
2023-11-22
随着人们对科学数据共享重要性认识的不断提高,越来越多的科研资助机构要求受资助者在申请科研资助时提交相应的数据管理计划,阐明研究者将如何对科研过程中产生的科学数据进行管理与使用。这些机构大多在其资助指南中明确规定资助申请者须提交数据管理计划。当申请项目被批准后,管理者会对提交的年度进展和最终报告中对数据管理计划的实施进行评估。......
2023-11-22
国际科技数据委员会国际科技数据委员会是国际科学理事会于1966年建立的一个跨学科学术委员会,致力于提高科技数据的质量、可靠性、管理和可获取性,推动和鼓励对科学技术有重要价值的可靠的数值数据进行编辑、评价、传播。目前,项目先后成功召开了巴西圣保罗会议、南非普里托利亚会议和美国华盛顿会议,相关活动正按计划进行。......
2023-11-22
调查还显示,部分图书馆新设数据监护部、数字学术和服务中心等部门,专门负责科学数据管理服务的设计和实施。不仅如此,一些名称相同的岗位,其工作职责也存在较大差异。而据我们调查,著名的iSchool联盟已有25所学院开设与科学数据管理有关的课程,占成员总数近2/3。因此,建立科学数据管理人才培育体系对我国图书情报教育机构而言应是当务之急。......
2023-11-22
《国家医药卫生科学数据共享网评估指标体系》包括3个一级指标、8个二级指标和16个三级指标。董诚、赵伟与涂勇从机构的保障能力、科学数据自身条件、对外服务能力和综合效能4个方面构建了我国科学数据机构共享绩效评估指标体系,该指标体系包括18个二级指标[7]。表7-2科学数据共享平台绩效评估指标体系续表......
2023-11-22
不仅如此,各国政府和科研机构都认识到了科学数据保存与共享的重要性,纷纷加大了对其投入。而无论是对于决策者还是科研人员来说,如果能对数据保存与共享的成本与效益进行量化评估,并从经济学角度证明数据共享的效益大于数据保存的成本,无疑能说服他们更好地支持数据保存与共享。本书拟在借鉴国内外有关研究成果的基础上,提出科学数据保存与共享的成本与效益评估的模型框架,从而为相关研究和实践提供理论支撑与参考。......
2023-11-22
关于数据保存与共享的成本与效益评估的研究,国内尚没有相关研究成果。因此,他们对Beagrie模型进行了扩展,将用户存储和访问获取的成本包含在模型中,较全面地包含了数据保存与共享活动中可能产生的各种成本。......
2023-11-22
相关推荐