首页 理论教育科学数据管理与共享的主要困难与解决方案

科学数据管理与共享的主要困难与解决方案

【摘要】:缺乏有效的数据管理工具/软件、管理数据需要花费大量的时间和精力、不知道如何为数据创建索引或元数据是科研人员在管理和利用科学数据过程中遇到的主要困难。调查对象认为应由科研人员决定的事项有:哪些数据应进行长期保存、哪些数据应进行共享、数据是否涉及个人信息或隐私、为数据添加合适的元数据。

通过对以上调查数据的分析与总结,可以得出以下结论:

(1)实验室实验和网络采集是科研人员获取科学数据的主要途径

我国科研人员获取科学数据的主要途径有:实验室实验、网络采集、社会调查、实地观测、建模或模拟等。不同学科和领域的科研人员收集获取科学数据的方式有所不同:理工农医领域以实验室试验为主,辅之以实地观测、建模/模拟和网络采集;而人文社科领域则主要通过社会调查和网络采集的方式获取科学数据。

(2)科研人员缺少数据管理的意识和专业技能,科学数据保存与管理的现状不容乐观

我国大部分科研人员缺少科学数据管理的意识和专业技能,对科学数据保存与管理的现状不容乐观。78%的调查对象没有使用专门保存和管理科学数据的工具/软件,已经使用的只有8%。缺乏有效的数据管理工具/软件(60.83%)、管理数据需要花费大量的时间和精力(54.26%)、不知道如何为数据创建索引或元数据(31.87%)是科研人员在管理和利用科学数据过程中遇到的主要困难。调查对象希望的科学数据服务主要有:数据分析处理(67.15%)、数据管理(44.53%)、数据保存(35.55%)。近70%的调查对象都发生过(包括偶尔发生和经常发生)重要科学数据丢失/损毁的现象。这些都说明我国科研人员数据管理的水平与意识亟待加强,也说明在制定相关政策时,应充分考虑科研人员可能面临的困难,为他们管理、利用和共享科学数据提供指导与帮助,以更好地促进科学数据的管理与共享。

(3)科学数据共享不充分给科研人员获取数据带来了较大困难

目前我国尚未制定国家层面的科学数据管理与共享政策,政府资助的研究产生的科学数据大多分散在科研机构和科研人员手中,使得科学数据共享不足,科研人员获取科学数据较困难。

调查发现,尽管大部分调查对象有在项目结束后被要求提交科学数据的经历,但这些数据仅仅是提交给科研项目或科研团队负责人,并没有进一步汇总到相关数据共享中心。科研项目结束后科学数据的去向主要有3个:项目负责人(59.12%)、分散在项目组成员手里(42.82%)、某项目成员(28.95%)。调查对象在收集和获取科学数据过程中遇到的困难和障碍主要有:收集到的数据不符合要求(56.93%)、数据收集或获取成本太高(56.2%)、难以找到所需数据(35.77%)。这些困难和障碍与我国科学数据公开/共享程度低不无关系,也说明了推动科学数据共享的重要性。同时,调查对象希望的科学数据服务包括:数据查找与获取(56.45%)、数据交流与共享(52.31%),也说明了有效获取和共享科学数据是科研人员的迫切需要。

(4)多数科研人员都有过共享科学数据的经历,但共享途径以人际关系为主

近80%的调查对象都从其他途径获得过科学数据,包括经常(15%)和偶尔(63%),60%的调查对象曾经向其他人提供过科学数据,其中绝大部分(57%)都是无偿提供。这说明大多数科研人员都有过共享科学数据的经历,也说明科研人员对科学数据共享有着广泛的需求。但我国科研人员获取和共享科学数据的途径以人际关系为主,并且具有两个特点:①优先从自己周围特别是与自己关系密切或有科研合作关系的人员那里获取科学数据(如从导师、师兄/师姐、学长、研究团队成员、有合作关系的同行等);②科学数据共享总体上是从较高社会地位的人向较低社会地位的人传播。科研人员在向其他人提供科学数据时也符合上述特点,即:①倾向于向与自己关系密切且有科研合作关系的人员提供科学数据(如导师、师兄/师姐、学长、研究团队成员、师弟/师妹、学弟/学妹、学生、有合作关系的同行等);②首先向比自己社会地位高的人提供,其次向和自己同等社会地位的人提供,再次向比自己社会地位低的人提供。

此外,公共数据共享中心/网站是科研人员获取科学数据非常重要的途径,一方面可以避免通过人际关系共享数据中的利益纠纷,另一方面也可大大扩大科学数据共享的范围。随着我国科学数据管理与共享政策的制定和相关基础设施的完善,公共数据共享中心/网站获取和共享数据将成为重要的科学数据共享方式。

调查对象对不同对象的数据共享意愿是不同的,对于导师、师兄/师姐、学长、师弟/师妹、学弟/学妹、学生和研究团队成员以全部无偿共享为主,部分有偿共享为辅。对于有合作关系的同行和同事,以部分无偿共享,有偿共享部分数据为主。而对于其他人员,则以不愿意共享为主,有偿共享为辅。

(5)互助互惠和信任是科研人员共享科学数据的主要因素

调查发现,互助互惠原则是科研人员共享科学数据最主要的原因,此外,对共享对象的信任也是重要因素。科研人员不愿意共享科学数据的原因有:①数据涉及保密,按规定不能公开;②担心数据被不正当使用;③数据来之不易,不愿意无条件共享。这说明在科学数据共享过程中明确数据的保密级别、完善数据共享过程中的利益平衡机制及引用机制,消除科研人员的担心和疑虑,对推动和促进科学数据共享是非常重要的。(www.chuimin.cn)

(6)绝大多数调查对象赞成制定科学数据管理与共享政策

76%的调查对象赞成制定科学数据管理与共享政策。对于政策应包含的内容,调查对象认为最重要的是三个方面:项目开始前要制定数据管理与保存计划(68.61%)、明确科研人员对科学数据的管理与保存职责(66.67%)、明确科学数据的归属权和知识产权(64.96%)。调查对象认为应由科研人员决定的事项有:哪些数据应进行长期保存(61.32%)、哪些数据应进行共享(45.86%)、数据是否涉及个人信息或隐私(65.58%)、为数据添加合适的元数据(44.99%)。调查对象认为应由研究人员所属机构决定的事项有:数据的保存期限(50.39%),而应由国家决定的事项是:数据是否涉及机密(49.1%)。

调查对象对于科学数据所有权的意见并不一致,借鉴国外的科学数据管理与共享政策,我国在制定相关政策时应根据实际情况具体规定。

(7)科研人员对制定科学数据管理与共享政策存在一些担心/顾虑

科研人员对制定科学数据管理与共享政策的担心和顾虑主要来自两个方面:

一是担心政策的实施会危及自身利益而不愿意共享,如:①对自己花费较多时间和精力获得的科学数据不愿意公开共享;②担心数据公开和共享后会暴露自己的研究内容,削弱自己的科研竞争力;③担心会给自己增加新的麻烦或负担,不愿意花费过多的时间和精力用于数据管理与共享。

二是由于对科学数据管理与共享政策的不理解而存在不必要的担心,如:①担心数据安全问题,担心数据丢失、损毁,被窃取或被不正当使用;②担心政策的执行和落实问题,能否得以顺利实施和收到预期效果;③数据共享的权利和义务能否得到平衡,能否保证数据共享与使用过程中的公平性和规范性;④担心科学数据政策会给数据获取和共享带来更多限制,使数据获取或共享更加困难。

前一种观点是由于科研人员不理解科学数据管理与共享政策的重要意义,仅从自身利益考虑问题造成的,后一种观点是由于科研人员对科学数据管理与共享政策的目的和内容不够理解而出现的。这都说明科研人员对科学数据政策不够理解或存在着误解,也说明在制定和实施科学数据管理与共享政策时,一方面要加强对科研人员的宣传和教育,使他们充分明白科学数据管理与共享的目的、意义和内容,支持政策的实施,另一方面也要注意数据共享过程中的利益平衡、产权归属、数据安全和对数据管理提供必要的经费资助与支持服务,以确保政策的科学性与合理性,最大限度地减少政策实施的阻力,确保政策的效果。

【注释】

[1]胡永生,刘颖.基于用户调查的高校科学数据管理需求分析[J].图书情报工作,2013(6):28-32,78.

[2]刘国忠,刘辉,赵鹏.关于人类年龄分段的体育学研究[J].科教文汇(上旬刊),2013(8):150,156.

[3]周成海,孙启林.教师知识分享意愿低落的成因与应对[J].教育发展研究,2006(19):31-35.

[4]周成海,孙启林.教师知识分享意愿低落的成因与应对[J].教育发展研究,2006(19):31-35.