表6.9数据管理的利益相关者分析6.5.2.2开放科研数据的影响因素开放科研数据受到社会政治、经济、技术和文化以及个人动机等多方面的影响。另一方面,科研人员也面临压力和诱惑,其开放科研数据的心态和动机实际上十分复杂。表6.10开放科研数据影响因素分析(续表)......
2023-11-27
6.5.1.1 科研数据的来源
2010年2月,皮特·穆瑞-让斯特(Peter Murray-Rust)等科学家发布了数据共享的奔腾原则(Panton Principle),认为“开放科研数据”是指这些数据应该能通过因特网被任何人以任何目的自由地下载、复制、分析、再加工、导入软件,并且没有资金、法律、技术以及上网条件的障碍[130]。梅兰妮·凯沫芙(Melanie Chernoff)认为,开放科研数据的范围主要指公共资金资助的科研数据。公共资金通常来源于政府或非营利组织。因此,根据资金来源,数据可以划分为私人部门数据、政府数据和既不属于政府又不属于私人的公有领域数据三类。开放数据位于公有领域数据和政府数据之间,一般不涉及私人数据(见图6.12)。
图6.12 开放数据关系图[131]
政府信息“以开放为原则,不开放为例外”,因而政府数据开放和再利用是开放数据运动的主要领域。其次,公有领域的数据并不等于开放数据。参照公有领域作品的构成,公有领域数据大致包括知识产权法颁布前的数据、保护期届满的数据、不受保护的数据以及所有者弃权的数据等。理论上,任何人对于公有领域的作品都可以免费使用,包括复制、传播、表演、展览,以及衍生新的作品等。但实际上,公有领域的作品(含数据)并不一定可以免费获得。例如老地图、老照片、古籍等资料,即便属于公有领域,其实物保管者出于保护或收藏等目的会设置一些障碍,公众自由获取还是有难度的。此外,开放数据通常是指所有者采用许可方式授权或弃权的数据。因此开放数据只占公有领域数据的一小部分。第三,开放数据不涉及私人领域并不表示与私人领域毫不相干。首先,非营利组织如果保留数据的所有权则该数据应当划归私人部门。其次,开放科研数据倡导者的动机正是为了建立一种科研数据的授权或弃权机制,避免科研数据通过出版合同合法地被变成私人数据。
6.5.1.2 科研数据的类型
按照奔腾原则资助机构“开放知识基金会”的解释,这些科研数据是指在论文中发表或文后附带的原始实验数据,包括名为“附加信息”、“支撑材料”等与论文同时出版的数据,与实验相关的图表中的数据,捕捉和报告科学现象的图像,采集原始资料的视音频数据。从学科上看,奔腾原则主要面向自然科学和工程技术,但并不排斥人文和社会科学。如果把观察、实验、访谈、计算等原始数据(及其元数据)看作“树根”的话,那么,在“树根”与“果实”(创新成果)之间还有许多作为枝干的中间层数据,例如衍生的数据、混搭(Mash up)的数据、关联的数据、可视化的数据、转换格式的数据等。奔腾原则主张开放原始数据是比较容易操作的,也是数据挖掘和再利用的基础。从源头开放数据可以简化中间层数据的法律关系,不失为一种务实的做法。(www.chuimin.cn)
这些数据的典型特征是数据集(dataset)。按照OECD的术语界定,数据集是指任何有组织的数据集合。这个概念颇具弹性,大至相当于数据库,小至一个事件(a case level)的数据集合,甚至是一段时间内相同结构的一组数据。数据集侧重的是数据自身的关联性、数字内容的机读性和可运算性。开放数据集可以避免主张开放数据库的误解和侵权风险,因而成为开放数据运动的对象。
6.5.1.3 科研数据的权利及归属
合法地获取、再利用、衍生、再传播以及长期保存科研数据集需要明确其归属以及复制传播等权利。关于数据集目前并无明确的法律规定,因此我们首先参考数据库的适用法规。《伯尔尼公约》将数据库归为文字作品,独创性的程度允许成员国自由裁定。《世界知识产权组织版权条约》(WCT)第5条将数据库作为汇编作品看待。实践中,各国对于数据库采取了不同的保护方式。例如,欧盟对于具有“独创性”的数据库给予著作权保护,不够“独创”的给予特别保护。中国、德国、美国的著作权法根据“独创性”原则给予数据库著作权保护。同时,WCT第2条规定:“版权保护延及表达,而不延及思想、过程、操作方法或数学概念本身。”因此,科研数据(集)是否属于著作权保护的“作品”要视具体情况而定。其判断标准有二:①该数据集是否属于作品;②是否具有原创性。
数据集所有权归属原则与作品的归属原则相似,即要综合考虑创建者、资助者以及影响权利归属的协议因素。就原始科研数据而言,无论其是否受版权法保护都不影响掌控数据的个人或组织对数据的所有权和占有权要求。尽管多数学者不知道科研数据的所有权归属,但澳大利亚的一项调查显示,43%的科研人员认为数据应当归自己,45%的人认为归属机构[132]。习惯上,科研数据由创建者保存,但发布、存储或共享数据则往往受到所在单位、资助者、出版者等多方面政策的影响。英国研究信息网(Research Information Net,RIN)认为主张所有权可能是基金或机构用以推动科研数据公开、实现潜在再利用价值的重要杠杆。
瑙米·库恩等学者以英国地理学学科库GRADE为例分析了衍生数据的知识产权问题。第一步需要获得多个来源数据的权利许可。例如,要分别获得JISC与英国陆地测量部(Ordnance Survey,OS)的数据使用许可、开放存取许可,谈判购买商业图片资料,获取NASA免费卫星图片数据以及皇家著作权资料等。由于各种许可协议限制的范围可能不同,因此需要建立一个有效的协议管理系统。第二步要验证和抽取数据。在欧洲,地理信息数据库的验证要遵守数据库特别保护要求。不论“实质性部分”来源于原始数据库还是第三方数据库,未经授权使用“实质性部分”就会侵犯抽取权和再利用权利。经过多次抽取和混搭,衍生作品已经无法区分来源文件。参照版权法的规定,新生数据集(衍生作品)要继承原有数据的著作权条款,使用最受限制的协议。那么如果多个许可协议的期限不同,则遵照期限最短的许可协议,这会严重影响数据挖掘和再利用的价值。有的许可条件要求许可期满销毁衍生数据[133],因此只有从源头开放数据,数据挖掘和再利用技术才有用武之地。
有关开放型机构知识库著作权管理研究的文章
表6.9数据管理的利益相关者分析6.5.2.2开放科研数据的影响因素开放科研数据受到社会政治、经济、技术和文化以及个人动机等多方面的影响。另一方面,科研人员也面临压力和诱惑,其开放科研数据的心态和动机实际上十分复杂。表6.10开放科研数据影响因素分析(续表)......
2023-11-27
MySQL要求AUTO_INCREMENT属性用于作为主键的列。与之相反,忽略BINARY属性时,将使用不区分大小写的方式排序。否则,默认值将依赖于字段的数据类型。简言之,提供该属性是为了保证数据库兼容性。将不允许向该列插入NULL值。建议在重要情况下始终使用NOT NULL属性,因为它提供了一个基本验证,确保已经向查询传递了所有必要的值。PRIMARY KEYPRIMARY KEY属性用于确保指定行的唯一性。......
2023-10-29
内容平台是数字内容与平台的结合,它虽然只是一种内容的新形态,但与印刷和电子媒体相同,对社会、政治、经济乃至人类生活的各个方面都产生着影响。以此反观内容平台的传播特性,可以说传播理论对内容平台的探讨虽然已经开始,但远不充分。而内容平台却是从根本上颠覆了集体接受的技术基础。这种原则在内容平台上可能被完全替代掉。内容平台的“传播人”特征还表现在它的复杂性上。......
2023-11-22
研究数据为美国纽约市犯罪数据,含110609条犯罪记录,包含案发时间、案发地经纬度、隶属街区和警局区域等信息,作如下处理:①删除位置属性、时间属性、事故描述属性缺失的数据行;②从日期字段中,提取年份、月份、日期、小时、工作日以及天数,在时间属性信息的选取上,多次试验后选择小时和天数这两个信息。......
2023-06-15
不同智能家电来自不同的企业,不同家电能够通过相应转化实现彼此影响和信息的相互交换。(二)智能家电的设计特征作为与人们朝夕相处的电器产品,尤其是与人们接触频率较高的智能家电,更体现了亲和性设计的理念。伴随着技术的进步,智能家电的设计特征主要有以下四个方面。......
2023-06-15
Hljky/kt-01湖里区教育科研“十一五”规划年立项课题研究进展一览表湖里区教师进修学校教育科学研究室编制(2009年9月第1版)Hljky/kt-02湖里区教育科研“十一五”规划课题申请·评审书[1]Hljky/kt-03湖里区教育科研“十一五”规划课题开题报告一、开题活动简况(开题时间、地点、评议专家、参与人员等)湖里区教师进修学校教育科学研究室编制(2009年9月第1版)Hljky......
2023-08-13
大数据在教育领域中的应用,主要包含在线决策、学习分析、数据挖掘等三大要素,所做的研究主要是预测分析、行为分析、学业分析等。贵阳市电化教育馆张籍认为[31]:从“成绩分数—知识点掌握—能力数据—能力曲线—多曲线变化图—多维数据模型”等几个层次对试卷进行挖掘,教育评价将由此步入大数据时代。......
2023-08-13
公益法律服务的专业性与律师的职业属性密切相关。从西方关于“公益法律服务”的最初定义来看,公益法律服务指的是无偿自愿承担专业性工作。为了适应这一系列的变化,公益法律服务既要保持传统的诉讼类专业服务,也要允许非诉讼类专业服务存在。在一个高度法治化的社会,对个人尊严、自由的保护要求确保法律的可接近性,就是所谓的“接近正义”。......
2023-08-04
相关推荐