首页 理论教育科学数据管理与共享的成本评估模型

科学数据管理与共享的成本评估模型

【摘要】:关于数据保存与共享的成本与效益评估的研究,国内尚没有相关研究成果。因此,他们对Beagrie模型进行了扩展,将用户存储和访问获取的成本包含在模型中,较全面地包含了数据保存与共享活动中可能产生的各种成本。

关于数据保存与共享的成本与效益评估的研究,国内尚没有相关研究成果。一些学者开展了政府[25]图书馆[26]的绩效评估研究,对评估的概念、原理、原则、绩效评估指标体系、评估方法进行了探讨。这类研究的思路是首先确定考察的指标体系以及各指标的权重,在此基础上得出考察对象在每个指标上的相应得分,最终得出考察对象的综合绩效。这些研究仅对考察对象的产出情况进行评估,以此比较多个考察对象之间的相对优劣,没有对其成本投入与产出效益进行对比研究。国外在这方面已开展了一些相关研究,如,由荷兰乌得勒支大学图书馆、荷兰代尔夫特理工大学图书馆及荷兰科学信息服务研究所共同开展的Roquade项目对数字信息保存的成本从元数据生成、管理与质量控制、技术架构三个方面进行考察[27]。Anna S.Palaiologk等提出了一种基于活动成本的模型用于评估数据长期保存所需要的成本[28]。我们将对较有代表性的几个数据保存成本评估模型进行考察,在其基础上提出数据保存成本评估方法。

(1)LIFE项目提出的信息资源生命周期模型

LIFE(Life Cycle Information for E-Literature)项目[29]的目标是提供一个框架,供图书馆和高等教育机构评估和识别数字资源长期保存的成本。LIFE模型的成本因素主要有以下几个:

①资源建设成本,购买或创建资源所需要的成本。

②资源获取成本,资源选择、提交、知识产权与许可、审查等产生的成本。

③资源导入成本,质量保证、元数据抽取和创建、组织和存储、已有资源目录的更新、建立索引等产生的成本。

④资源保存成本,主要是仓储提供、存储管理、资源部分、数据更新与维护等成本。

⑤内容保存成本,主要包括制定保存计划、开展保存行动、迁移和导入数字资源、评估和移除资源、资源揭示等成本。

⑥获取成本。包括提供访问、访问控制以及用户支持等方面的成本。

LIFE模型较全面地考虑了数字资源长期保存过程中涉及的各种成本,且该模型基于国际标准“开放档案信息系统”(OAIS)的参考模型(见图7-1),即将数字信息的保存分为“创建与导入”(Ingest)、“存储与管理”(Archival storagy,data management)、“访问与获取”(Access)三个阶段进行考察,有着较广泛的适用性,为图书馆和相关研究机构开展数字资源保存提供了成本分析和评估框架。

(www.chuimin.cn)

图7-1 OAIS的参考模型框架

(2)基于数据保存周期的成本评估模型

Beagrie等提出并完善了一个用于评估数据存储成本的模型(以下简称Beagrie模型),包括4个一级指标,13个二级指标和若干三级指标[30](见表7-11):

表7-11 基于数据保存周期的成本评估模型

Beagrie模型全面细致地考虑了数据存储过程中可能涉及的各种成本因素,为科研资助与管理机构进行数据存储库的建设提供了评估成本的依据。然而,Beagrie模型也存在着一些不足:

首先,该模型是为科研资助者和科研管理机构评估科研数据长期保存所需要的成本而提出的,并没有将科研人员提交、存储数据和用户检索、获取数据过程中所产生的成本考虑进去。而这些因素恰恰是影响数据中心是否受用户支持、能否长期生存发展的重要因素。

其次,该模型虽然对数据存储库的构建及数据存储与维护过程中可能产生的成本进行了全面细致的考虑,但由于指标划分过细,给模型的实际应用带来了不便。例如,模型中“存档阶段”下共细分为8个二级指标,每个二级指标下进一步细分出若干三级指标,但我们发现,实际评估时难以做到一一对应,因此,可以考虑减少指标的细分度,只保留二级指标或一级指标,以便提高模型的适用性。

(3)基于社会效益的数据保存与共享成本评估模型

Jenny,Suzanne和Oppenheim等通过对实际数据共享活动进行深入分析指出,虽然Beagrie模型较全面地涵盖了数据保存过程中可能产生的各种成本,但并没有考虑到用户向数据中心提交数据和检索获取数据过程中的成本[31]。因此,他们对Beagrie模型进行了扩展,将用户存储和访问获取的成本包含在模型中,较全面地包含了数据保存与共享活动中可能产生的各种成本。我们认为可以在其基础上进行适当调整以构建科学数据保存与共享成本评估模型。