不仅如此,各国政府和科研机构都认识到了科学数据保存与共享的重要性,纷纷加大了对其投入。而无论是对于决策者还是科研人员来说,如果能对数据保存与共享的成本与效益进行量化评估,并从经济学角度证明数据共享的效益大于数据保存的成本,无疑能说服他们更好地支持数据保存与共享。本书拟在借鉴国内外有关研究成果的基础上,提出科学数据保存与共享的成本与效益评估的模型框架,从而为相关研究和实践提供理论支撑与参考。......
2023-11-22
关于数据保存与共享的成本与效益评估的研究,国内尚没有相关研究成果。一些学者开展了政府[25]和图书馆[26]的绩效评估研究,对评估的概念、原理、原则、绩效评估指标体系、评估方法进行了探讨。这类研究的思路是首先确定考察的指标体系以及各指标的权重,在此基础上得出考察对象在每个指标上的相应得分,最终得出考察对象的综合绩效。这些研究仅对考察对象的产出情况进行评估,以此比较多个考察对象之间的相对优劣,没有对其成本投入与产出效益进行对比研究。国外在这方面已开展了一些相关研究,如,由荷兰乌得勒支大学图书馆、荷兰代尔夫特理工大学图书馆及荷兰科学信息服务研究所共同开展的Roquade项目对数字信息保存的成本从元数据生成、管理与质量控制、技术架构三个方面进行考察[27]。Anna S.Palaiologk等提出了一种基于活动成本的模型用于评估数据长期保存所需要的成本[28]。我们将对较有代表性的几个数据保存成本评估模型进行考察,在其基础上提出数据保存成本评估方法。
(1)LIFE项目提出的信息资源生命周期模型
LIFE(Life Cycle Information for E-Literature)项目[29]的目标是提供一个框架,供图书馆和高等教育机构评估和识别数字资源长期保存的成本。LIFE模型的成本因素主要有以下几个:
①资源建设成本,购买或创建资源所需要的成本。
②资源获取成本,资源选择、提交、知识产权与许可、审查等产生的成本。
③资源导入成本,质量保证、元数据抽取和创建、组织和存储、已有资源目录的更新、建立索引等产生的成本。
④资源保存成本,主要是仓储提供、存储管理、资源部分、数据更新与维护等成本。
⑤内容保存成本,主要包括制定保存计划、开展保存行动、迁移和导入数字资源、评估和移除资源、资源揭示等成本。
⑥获取成本。包括提供访问、访问控制以及用户支持等方面的成本。
LIFE模型较全面地考虑了数字资源长期保存过程中涉及的各种成本,且该模型基于国际标准“开放档案信息系统”(OAIS)的参考模型(见图7-1),即将数字信息的保存分为“创建与导入”(Ingest)、“存储与管理”(Archival storagy,data management)、“访问与获取”(Access)三个阶段进行考察,有着较广泛的适用性,为图书馆和相关研究机构开展数字资源保存提供了成本分析和评估框架。
(www.chuimin.cn)
图7-1 OAIS的参考模型框架
(2)基于数据保存周期的成本评估模型
Beagrie等提出并完善了一个用于评估数据存储成本的模型(以下简称Beagrie模型),包括4个一级指标,13个二级指标和若干三级指标[30](见表7-11):
表7-11 基于数据保存周期的成本评估模型
Beagrie模型全面细致地考虑了数据存储过程中可能涉及的各种成本因素,为科研资助与管理机构进行数据存储库的建设提供了评估成本的依据。然而,Beagrie模型也存在着一些不足:
首先,该模型是为科研资助者和科研管理机构评估科研数据长期保存所需要的成本而提出的,并没有将科研人员提交、存储数据和用户检索、获取数据过程中所产生的成本考虑进去。而这些因素恰恰是影响数据中心是否受用户支持、能否长期生存发展的重要因素。
其次,该模型虽然对数据存储库的构建及数据存储与维护过程中可能产生的成本进行了全面细致的考虑,但由于指标划分过细,给模型的实际应用带来了不便。例如,模型中“存档阶段”下共细分为8个二级指标,每个二级指标下进一步细分出若干三级指标,但我们发现,实际评估时难以做到一一对应,因此,可以考虑减少指标的细分度,只保留二级指标或一级指标,以便提高模型的适用性。
(3)基于社会效益的数据保存与共享成本评估模型
Jenny,Suzanne和Oppenheim等通过对实际数据共享活动进行深入分析指出,虽然Beagrie模型较全面地涵盖了数据保存过程中可能产生的各种成本,但并没有考虑到用户向数据中心提交数据和检索获取数据过程中的成本[31]。因此,他们对Beagrie模型进行了扩展,将用户存储和访问获取的成本包含在模型中,较全面地包含了数据保存与共享活动中可能产生的各种成本。我们认为可以在其基础上进行适当调整以构建科学数据保存与共享成本评估模型。
有关科学数据管理与共享的理论与实践的文章
不仅如此,各国政府和科研机构都认识到了科学数据保存与共享的重要性,纷纷加大了对其投入。而无论是对于决策者还是科研人员来说,如果能对数据保存与共享的成本与效益进行量化评估,并从经济学角度证明数据共享的效益大于数据保存的成本,无疑能说服他们更好地支持数据保存与共享。本书拟在借鉴国内外有关研究成果的基础上,提出科学数据保存与共享的成本与效益评估的模型框架,从而为相关研究和实践提供理论支撑与参考。......
2023-11-22
与科学数据保存与共享的成本相比,数据保存与共享的成本更加难以识别和确认。基于效益分类的数据共享效益识别模型Beagrie等将数据保存与共享的效益划分为三个维度进行考察[32],见表7-12。因而,我们应全面考虑数据保存与共享所产生的成本。另一方面,相对于数据保存与共享的成本,数据共享所产生的效益较难以量化评估,但我们可以从用户通过数据共享带来的成本节省途径来进行识别和量化。......
2023-11-22
评估方法我们采用层次分析法设置评估指标的权重。所用工具是目前较为成熟的层次分析法软件yaaph0.5.2。评估步骤采用层次分析法设置科学数据共享平台绩效评估一、二级指标权重的具体步骤如下:①根据判断标度为指标体系中的所有一级指标及二级指标构建判断矩阵。表7-3比例尺度表②根据专家问卷调查结果,利用层次分析法软件yaaph 0.5.3进行矩阵判断和群决策计算,得到各一级指标的权重W1i,判断矩阵一致性比例为0.0093,通过一致性检验。......
2023-11-22
评估结果的计算采用7.1.2节中“评估方法”可计算出每个科学数据共享平台绩效评估的评分结果。人才队伍是科学数据共享平台的关键因素之一,其下设有服务团队规模及人员素质2个三级指标。管理制度是科学数据共享平台高效运行的重要支撑,其下包括政策法规和机构设置2项三级指标。加权值最低的是国家材料环境腐蚀(老化)科学数据共享服务网,为0.4592,该平台仅有11个数据集。其中加权值最高的是地震科学数据共享中心,为1.1561。......
2023-11-22
《UNESCO指南》将在国家与国际层面的决策和政策制定者中得到广泛应用。至2014年9月,WDC在全球共有89个数据中心,这些数据中心几乎涵盖了地球和日地关系科学的各个领域,每个数据中心承担了汇集某个领域的科研数据并承担向科技界开放和服务的任务。②所有将要共享的数据、元数据和资料都应在最短的时间内以最低的成本提供共享。此外,WDS于2011年9月在......
2023-11-22
随着人们对科学数据共享重要性认识的不断提高,越来越多的科研资助机构要求受资助者在申请科研资助时提交相应的数据管理计划,阐明研究者将如何对科研过程中产生的科学数据进行管理与使用。这些机构大多在其资助指南中明确规定资助申请者须提交数据管理计划。当申请项目被批准后,管理者会对提交的年度进展和最终报告中对数据管理计划的实施进行评估。......
2023-11-22
国际科技数据委员会国际科技数据委员会是国际科学理事会于1966年建立的一个跨学科学术委员会,致力于提高科技数据的质量、可靠性、管理和可获取性,推动和鼓励对科学技术有重要价值的可靠的数值数据进行编辑、评价、传播。目前,项目先后成功召开了巴西圣保罗会议、南非普里托利亚会议和美国华盛顿会议,相关活动正按计划进行。......
2023-11-22
调查还显示,部分图书馆新设数据监护部、数字学术和服务中心等部门,专门负责科学数据管理服务的设计和实施。不仅如此,一些名称相同的岗位,其工作职责也存在较大差异。而据我们调查,著名的iSchool联盟已有25所学院开设与科学数据管理有关的课程,占成员总数近2/3。因此,建立科学数据管理人才培育体系对我国图书情报教育机构而言应是当务之急。......
2023-11-22
相关推荐