首页 理论教育 全网维权监测平台的合法数据抓取与共享

全网维权监测平台的合法数据抓取与共享

【摘要】:于是,以网络“爬虫”为主要技术的各类全网维权监测平台应运而生,通过网络“爬虫”对全网数据进行抓取、比对,能够迅速筛查出侵权内容,满足广大版权权利人对版权资产保护及维权的需求,在这种场景下,数据的抓取和利用就具有正当性,不构成不正当竞争。为避免超级网络平台收集海量数据后形成数据垄断,应当更多允许第三方的数据“爬虫”抓取原始数据或基础数据,进行数据的合理使用,从而实现数据共享与数据的普惠性。

提出隐私场景理论的海伦·尼森鲍姆(Helen Nissenbaum)教授指出,数据隐私保护的基本原则与关键在于实现数据的“场景性公正”(contextual integrity), 即要在具体场景中实现个人数据与信息的合理流通。数据使用的场景不同,使用目的和方式不同,行为性质和后果是不同的,不能一刀切地进行规制,而是要结合具体场景进行考量。数据竞争主要规制的是不正当竞争,即那些没有正当理由而损害其他经营者或消费者利益的行为,而有些竞争是正当的,是数字经济发展所必要的,应当予以保护,笔者试列举几种主要情形。

1. 版权维权

随着各类资讯类、视频类平台的兴起,盗版行为屡禁不止,且具有数量多、范围广、分散性强的特点,对于版权权利人来说,如果通过传统的人工排查方式进行侵权监测,成本过高且效率太低。于是,以网络“爬虫”为主要技术的各类全网维权监测平台应运而生,通过网络“爬虫”对全网数据进行抓取、比对,能够迅速筛查出侵权内容,满足广大版权权利人对版权资产保护及维权的需求,在这种场景下,数据的抓取和利用就具有正当性,不构成不正当竞争。

2. 公共利益目的

当“爬虫”平台具有公益性或具有公共基础设施的性质时,应当允许“爬虫”平台进行数据抓取。美国与欧盟等地区认为,即使对于受版权保护的信息与数据,搜索引擎对其的数据抓取行为也属于合理使用的范围。为避免超级网络平台收集海量数据后形成数据垄断,应当更多允许第三方的数据“爬虫”抓取原始数据或基础数据,进行数据的合理使用,从而实现数据共享与数据的普惠性。[7]

3. 不公开使用

如果数据“爬虫”抓取公开数据之后不公开使用,也不构成不正当竞争。因为被抓取内容不会出现在抓取方的平台中,用户也不会从抓取方的平台访问、获取到被抓取内容,抓取方不会因为抓取行为获得不正当利益,这种抓取行为是正当的。