不仅如此,各国政府和科研机构都认识到了科学数据保存与共享的重要性,纷纷加大了对其投入。而无论是对于决策者还是科研人员来说,如果能对数据保存与共享的成本与效益进行量化评估,并从经济学角度证明数据共享的效益大于数据保存的成本,无疑能说服他们更好地支持数据保存与共享。本书拟在借鉴国内外有关研究成果的基础上,提出科学数据保存与共享的成本与效益评估的模型框架,从而为相关研究和实践提供理论支撑与参考。......
2023-11-22
(1)评估结果的计算
采用7.1.2节中“(1)评估方法”可计算出每个科学数据共享平台绩效评估的评分结果。三级指标的评分如表7-6所示,将每个二级指标下的三级指标的评分求和再与三级指标的个数相除,得出平均值,即为二级指标分数,设各项二级指标评分分值为Pij(见表7-7),二级指标的综合权重Wij,评分加权值为Fij,加权求和评估得分为F。Fij与F的计算公式分别为:
其中4表示一级指标的个数,j(i)表示第i个一级指标内包含的二级指标个数。
根据以上公式所得最终结果如表7-8所示。
(2)评估结果分析
①运行管理。
运行管理一级指标下设有人才队伍和管理制度2个二级指标,其综合权重分别为0.0728和0.0449(见表7-5)。
表7-6 8个科学数据共享平台三级指标评分表
续表
表7-7 8个科学数据共享平台二级指标分值
表7-8 科学数据共享平台绩效评估分值结果
·人才队伍。人才队伍是科学数据共享平台的关键因素之一,其下设有服务团队规模及人员素质2个三级指标。8个平台的加权值在0.3~0.8之间(详见表7-8)。加权值最高的地球系统科学数据共享平台(0.7280),40多家国内地学领域知名高校、世界数据中心和国际山地中心、美国马里兰大学等国际组织和机构参与了该平台的建设与运行服务,显示了其人才队伍素质、规模以及构成的国际化。其次是林业科学数据中心(0.6552),该中心有项目人员143人,包括研究员、高校教师和工程师;基础科学数据共享网(0.6188)拥有50名服务专员,并能提供邮件及电话进行实时咨询和表单咨询。加权值最低的是国家农业科学数据共享中心(0.3640),其在服务团队的规模和素质方面还有待改善。
·管理制度。管理制度是科学数据共享平台高效运行的重要支撑,其下包括政策法规和机构设置2项三级指标。加权值最高的是国家人口与健康科学数据共享平台(0.4732)(详见表7-8),该平台制定了包括科学数据资源、任务监督与验收、科学数据汇交管理及信息安全等管理办法等政策法规体系,从制度上保证平台的建设和运行,并成立了领导组、专家组、工作组、项目办公室,建立了多部门联合、分层管理、协同工作的运行服务组织管理体系。国家材料环境腐蚀(老化)科学数据共享平台(0.3592)制定有站网管理制度及试验站管理制度,建立了管理部、标准部、数据共享与应用服务部等部门。国家农业科学数据共享中心(0.3143)也制定了农业科学数据共享管理办法、农业科学数据汇交管理办法,并成立了“领导小组”“顾问组”“技术总体组”“工作组”“项目办公室”。林业科学数据中心加权值最低(0.1796),需要进一步加强其政策法规建设。
②数据资源。
数据资源主要是考察科学数据共享平台数据数量、数据的描述与组织等的情况,包括2个二级指标:数据产品、数据描述与组织。
·数据产品。该指标加权值在0.9184及以上(即三级指标评分在8分及以上)的共有4个平台,占50%;加权值在0.6888~0.9184(即三级指标在6~8分之间)的共3个平台,占37.5%;低于0.6888(即三级指标低于6分)的平台只有1个(详见表7-8)。其中,基础科学数据共享网的数据资源建设最为完备,其二级指标数据产品的加权值是1.1480,该平台建有448个数据库(集),数据总量达到了104.86TB(调查时间为2014年12月3日)。加权值最低的是国家材料环境腐蚀(老化)科学数据共享服务网,为0.4592,该平台仅有11个数据集。
·数据描述与组织。该指标共有2个三级指标,即数据描述、数据组织与集成。平台中是否有元数据描述、元数据标准或规范、元数据专栏以及数据的组织与集成方式、是否有分类标准或规范是此项指标考察的主要内容。该指标加权值在0.5784及以上(即三级指标平均分在8分及以上)共有5个,占62.5%;其余三个平台加权值均为0.4338(即三级指标平均分是6分),占37.5%(详见表7-8)。其中,加权值最高的是林业科学数据平台,为0.6507。该平台有元数据描述、元数据标准、元数据专栏、分类标准,元数据专栏下提供了两种数据的访问和获取的方式,但其只有1种数据组织方式。加权值较低的3个平台分别是国家材料环境腐蚀(老化)科学数据共享服务网、国家农业科学数据共享中心、中国气象科学数据共享服务网,均为0.4338。这三个平台均缺乏数据描述与组织的标准或规范。
③平台功能。
该指标主要考察共享平台的数据检索与服务功能,包括3个二级指标:检索与浏览、数据服务、平台服务。
·检索与浏览。该指标下设4个三级指标:检索方式、浏览方式、检索结果和响应速度。我们对平台提供的检索方式与浏览方式数量、检索结果的排序、二次检索及平台的响应速度进行了调查。其中,响应速度是通过“114la工具箱”[11]进行测试的(测试时间为2014年8月21日上午0:18~0:40)。评估的结果是:中国气象科学数据共享服务网加权值最高,为0.3760(见表7-8),该平台在其主页共提供了4种检索方式,分别是简单检索、数据分类检索、专题检索、数据定位检索;1种浏览方式,为分类浏览;其检索结果可按最近更新优先、主节点数据优先、相关度优先3种方式进行排序;其响应速度测试为0.144秒,居于中等速度。国家人口与健康科学数据共享平台和地震科学数据共享中心加权值较低,均为0.2820(见表7-8)。国家人口与健康科学数据共享平台在检索方式评估中得分最低,未在主页上提供任何数据检索方式,而是在点击进入的各数据库界面上提供不同的检索方式。(www.chuimin.cn)
·数据服务。该指标下设3个三级指标:可获取性、易用性和数据更新。该指标主要考察数据浏览下载是否方便、是否方便利用、数据是否持续更新等。其中,数据更新的调查时间为2014年9月1日。8个平台在此项调查中的得分差距较大(详见表7-8)。其中加权值最高的是地震科学数据共享中心,为1.1561。该平台无需注册登录,即可浏览数据,并可下载部分数据和元数据,可获取性较高;数据按照分类法组织,有分类标准规范,易于利用;地震目录每日更新,更新频率高。加权值最低的是国家农业科学数据共享中心,为0.5336。该平台只有一部分数据是可以直接浏览的,注册登录后才能够浏览其余数据,可获取性低;而其最新的数据更新时间为2011年,在8个平台中排在倒数第二位。
·平台服务。该指标的综合权重居二级指标综合权重的第二位,为0.1460(见表7-5)。该指标下设5个三级指标:数据下载、数据汇交、定制服务、链接有效性和信息发布频率。是否提供数据下载服务、数据汇交服务、定制服务,平台链接是否有效,信息发布的频率均是评估平台服务的重要指标。链接有效性是通过“SEOWHY在线死链接检测”[12]进行检测(测试时间为2014年9月1日)。信息发布频率调查日期为2014年12月3日。国家人口与健康科学数据共享平台加权值最高,为1.1972(见表7-8)。虽然该平台提供数据下载服务,但在登录后,仍有19个数据集(约占总数量的7%)需要向数据拥有单位申请方可下载,此项服务在8个平台中得分较低。该平台提供数据汇交服务,一些专题数据库内提供定制服务,其83个链接全部有效,半年内发布了24条信息(在8个平台中排在第二位)。国家材料环境腐蚀(老化)科学数据共享服务网加权值最低,为0.7008(见表7-8),该平台数据下载服务仅限高级用户,且未提供数据汇交服务和定制服务,因此其在此项调查中得分最低。
④服务效能及影响。
服务效能及影响是对科学数据共享平台服务的科研效能、社会效能等进行调查,也是4个一级指标中权重最高的一项。它包括4个二级指标:科研效能、引用情况、服务统计、用户满意度。
·科研效能。科研效能的综合权重在所有二级指标综合权重中排名第一,说明数据共享中心的建设旨在为科学事业提供支撑,科研效能的高低很大程度上反映了平台的运作效率和运行价值。我们采用网站调查方法,对2008—2012年间平台支持科研的情况进行调研,统计各自对国家重大科技计划项目及对科技成果、专利、论文的支持情况(见表7-9)。
表7-92008 —2012年8个科学数据共享平台的服务效能
科研绩效加权值较高的是地球系统科学数据共享平台和国家人口与健康科学数据共享平台,分别为1.2008和1.1258(见表7-8)。国家人口与健康科学数据共享平台在对国家重大科技计划项目上体现出较大的优势,提升了该平台的服务效能及影响。该平台还开发了用于科研项目和科研成果查询的工具软件,方便了用户使用。此外,地球系统科学数据共享平台在“973项目”、“863项目”、环境保护、铁路建设、载人航天工程、气候考察、民生工程等项目中贡献较大,在平台数据资源的支持下,发表科技论文与专著达到611篇,申请专利12项。
·引用情况。引用情况主要指平台名称的被引用次数。在进行检索时,考虑到各共享平台先后经历过“✕✕共享试点”“✕✕共享中心”“✕✕共享服务网”以及“✕✕共享平台”等不同的阶段,为防漏检,检索时采用多个检索词,检索词之间通过逻辑“或”的方法进行全文检索。检索数据库为中国知网,检索时间为2014年9月1日。检索结果按数量排名前三的分别为:中国气象科学数据共享服务网(2010条)、地球系统科学数据共享平台(371条)、地震科学数据共享中心(191条)。
·服务统计。注册用户数量是科学数据共享平台价值的重要指标之一,平台的访问量与被链接次数也在一定程度上反映了平台受关注度以及平台的潜在价值。我们分别统计了平台的注册数量、访问量和被链接次数,截止日期为2013年3月23日(见表7-10)。其中,被链接次数利用网站“站长工具”[13]进行检测。
表7-108 个科学数据共享平台的服务统计调查表
续表
在服务绩效加权值方面,基础科学数据共享网和地球系统科学数据共享平台分别为0.3345和0.2702,分别排在第一位和第二位(见表7-8)。在注册人数和访问量指标上,地球系统科学数据共享平台、中国气象科学数据共享服务网及基础科学数据共享网显示出较高的用户参与度,此外,基础科学数据共享网的被链接次数居于第一位(63次),林业科学数据平台和国家农业科学数据共享中心在这项指标上则没有突破(见表7-10)。
·用户满意度。用户满意度在所有二级指标的综合权重中排名第三位,为0.1341(见表7-5)。服务对象满意度是平台绩效评估中一个十分重要的指标。这项指标,我们共设置了5个打分标准:十分满意(10分)、满意(9分)、比较满意(8分)、一般(6分)、不满意(5分)。加权值高于1的4个平台分别为:基础科学数据共享网(1.2069)、地球系统科学数据共享平台(1.0728)、地震科学数据共享中心(1.0728)、中国气象科学数据共享服务网(1.0728)(详见表7-8)。
8个科学数据共享平台绩效评估的最终结果按照加权求和评估得分F从高到低排列依次为(详见表7-8):地球系统科学数据共享平台(76.962)、基础科学数据共享网(76.595)、国家人口与健康科学数据共享平台(71.577)、地震科学数据共享中心(66.296)、中国气象科学数据共享服务网(65.159)、林业科学数据中心(56.894)、国家农业科学数据共享中心(55.068)、国家材料环境腐蚀(老化)科学数据共享服务网(52.528)。
(3)对评估结果揭示问题的分析
通过此次调查,我们发现我国科学数据共享平台建设中存在以下一些主要问题:
①政策法规尚不完善。由调查得知,8个科学数据共享平台中,除国家人口与健康科学数据共享平台制定了14条法律法规及12条平台政策法规外,其余7个平台中,有的平台只制定了涉及数据资源共享及分类的政策法规或管理制度。如,国家材料环境腐蚀科学数据共享服务网只有网站的管理制度,林业科学数据共享平台没有提供相关的政策法规。完善的政策法规应包括数据从生产到共享全过程相关的数据汇交、质量控制、运行、维护管理、客户管理、安全和应急措施等方面的规章制度,政策法规建设是保障科学数据共享平台可持续运行与服务的前提,需要引起足够的重视与实际投入。
②缺少数据描述与组织的标准或规范。标准和规范的制定是数据共享的前提。调查发现,国家农业科学数据共享中心和中国气象科学数据共享服务网没有元数据描述规范,国家材料环境腐蚀(老化)科学数据共享服务网、地球系统科学数据共享平台及国家农业科学数据共享中心没有数据分类标准或规范。科学数据共享平台的数据建设既应遵循元数据描述规范,也应制定数据分类标准规范。具体包括元数据标准化基本原则和方法、元数据的XML/XSD置标规则、科学数据共享工程数据分类编码方案、元数据检索和提取协议等科学数据共享领域的标准规范等。
③数据可获取性较低。8个科学数据共享平台中,仅有地震科学数据共享中心无需注册登录即可浏览数据,并可下载部分数据和元数据。其余的7个平台,用户如不登录只可以浏览部分数据。国家材料环境腐蚀(老化)科学数据共享服务网内一部分数据,若想浏览全部数据,还需填写申请表,待审批通过后方可浏览。对于数据下载,各平台的规定则更为严格。有的平台必须要提交下载申请,有的只有高级用户或核心用户才可下载部分数据。对于普通用户来说,若想浏览一些公开数据,还需注册登录,甚至填写申请表,等待审核,这无疑会降低平台的使用率,使其共享程度大打折扣。
④平台提供的服务形式较少。8个科学数据共享平台中,提供下载服务的有8个,提供数据定制服务的有5个(占62.5%),提供汇交服务的有3个(占37.5%),地球系统科学数据共享平台和国家人口与健康科学数据共享平台提供了全部的3项服务,但其所提供的定制服务仅为数据预定,国家人口与健康科学数据共享平台内的一些专题数据库内才提供定制服务。这些数据说明,目前我国科学数据共享平台所提供的服务形式单一、种类较少。共享平台应主要提供数据下载服务、数据汇交服务、定制服务等。服务是科学数据共享平台建立的目的,提供多种多样的服务才能使用户熟悉平台,从而提高平台的社会影响力。
⑤各个平台的科研效能差距较大。科研效能综合权重在所有二级指标的综合权重中排在首位,但其加权值普遍低于排在第二位的平台服务和第三位的用户满意度(见表7-8)。由此可见,目前我国科学数据共享平台的科研效能还较低。对科技成果、专利、论文产出的影响及对国家重大科技计划项目的支持作用亟待加强。而同一项科研效能指标相比,只有2个平台的加权值高于1,有5个平台的加权值在0.4~0.7之间。加权值最高的地球系统科学数据共享平台(1.2008)与加权值最低的林业科学数据中心(0.4503)相差0.7505。我们认为,科学数据共享中心建立的目的是服务于国家科研项目及重大科技计划项目,各个科学数据共享平台在科学研究、社会与经济的可持续发展等方面应发挥不可替代的作用,为国家重大工程建设、重要科技专项和计划提供科学依据。我国科学数据共享中心应该使数据价值最大化,发挥更高的科研效能。
有关科学数据管理与共享的理论与实践的文章
不仅如此,各国政府和科研机构都认识到了科学数据保存与共享的重要性,纷纷加大了对其投入。而无论是对于决策者还是科研人员来说,如果能对数据保存与共享的成本与效益进行量化评估,并从经济学角度证明数据共享的效益大于数据保存的成本,无疑能说服他们更好地支持数据保存与共享。本书拟在借鉴国内外有关研究成果的基础上,提出科学数据保存与共享的成本与效益评估的模型框架,从而为相关研究和实践提供理论支撑与参考。......
2023-11-22
关于数据保存与共享的成本与效益评估的研究,国内尚没有相关研究成果。因此,他们对Beagrie模型进行了扩展,将用户存储和访问获取的成本包含在模型中,较全面地包含了数据保存与共享活动中可能产生的各种成本。......
2023-11-22
评估方法我们采用层次分析法设置评估指标的权重。所用工具是目前较为成熟的层次分析法软件yaaph0.5.2。评估步骤采用层次分析法设置科学数据共享平台绩效评估一、二级指标权重的具体步骤如下:①根据判断标度为指标体系中的所有一级指标及二级指标构建判断矩阵。表7-3比例尺度表②根据专家问卷调查结果,利用层次分析法软件yaaph 0.5.3进行矩阵判断和群决策计算,得到各一级指标的权重W1i,判断矩阵一致性比例为0.0093,通过一致性检验。......
2023-11-22
而我国图书馆对开展科学数据管理与共享服务还没有引起足够的重视,尚未开展这项服务。高校图书馆科学数据服务水平有待提高对调查结果分析发现,这些图书馆开展的服务水平不一。还有一些图书馆正在探索和尝试开展这项服务,如加拿大不列颠哥伦比亚大学图书馆于2010年1月成立了专门工作组研究对图书馆开展科研数据管理服务进行研究[28]。......
2023-11-22
《UNESCO指南》将在国家与国际层面的决策和政策制定者中得到广泛应用。至2014年9月,WDC在全球共有89个数据中心,这些数据中心几乎涵盖了地球和日地关系科学的各个领域,每个数据中心承担了汇集某个领域的科研数据并承担向科技界开放和服务的任务。②所有将要共享的数据、元数据和资料都应在最短的时间内以最低的成本提供共享。此外,WDS于2011年9月在......
2023-11-22
数据来源本研究所使用的数据来自CNKI全文数据库,为了尽可能地保证查全率,检索主题为“科学数据”或“科研数据”的相关文献,时间设定为2003年至2013年,共获得2 221条记录。剔除与主题不符、重复刊载的论文和会议文献,有效记录为582条,并下载相应的题录数据。研究过程①统计高频词并构造共词矩阵。高频词不足以概括该领域的研究主题,需要两两统计这48个高频词在文献中出现的频次,利用Excel构造共词矩阵。③研究结果的分析和讨论。......
2023-11-22
与科学数据保存与共享的成本相比,数据保存与共享的成本更加难以识别和确认。基于效益分类的数据共享效益识别模型Beagrie等将数据保存与共享的效益划分为三个维度进行考察[32],见表7-12。因而,我们应全面考虑数据保存与共享所产生的成本。另一方面,相对于数据保存与共享的成本,数据共享所产生的效益较难以量化评估,但我们可以从用户通过数据共享带来的成本节省途径来进行识别和量化。......
2023-11-22
随着人们对科学数据共享重要性认识的不断提高,越来越多的科研资助机构要求受资助者在申请科研资助时提交相应的数据管理计划,阐明研究者将如何对科研过程中产生的科学数据进行管理与使用。这些机构大多在其资助指南中明确规定资助申请者须提交数据管理计划。当申请项目被批准后,管理者会对提交的年度进展和最终报告中对数据管理计划的实施进行评估。......
2023-11-22
相关推荐