全网维权监测平台的合法数据抓取与共享

2023-08-05 理论教育版权反馈

【摘要】：于是，以网络“爬虫”为主要技术的各类全网维权监测平台应运而生，通过网络“爬虫”对全网数据进行抓取、比对，能够迅速筛查出侵权内容，满足广大版权权利人对版权资产保护及维权的需求，在这种场景下，数据的抓取和利用就具有正当性，不构成不正当竞争。为避免超级网络平台收集海量数据后形成数据垄断，应当更多允许第三方的数据“爬虫”抓取原始数据或基础数据，进行数据的合理使用，从而实现数据共享与数据的普惠性。

提出隐私场景理论的海伦·尼森鲍姆（Helen Nissenbaum）教授指出，数据隐私保护的基本原则与关键在于实现数据的“场景性公正”（contextual integrity），即要在具体场景中实现个人数据与信息的合理流通。数据使用的场景不同，使用目的和方式不同，行为性质和后果是不同的，不能一刀切地进行规制，而是要结合具体场景进行考量。数据竞争主要规制的是不正当竞争，即那些没有正当理由而损害其他经营者或消费者利益的行为，而有些竞争是正当的，是数字经济发展所必要的，应当予以保护，笔者试列举几种主要情形。

1. 版权维权

随着各类资讯类、视频类平台的兴起，盗版行为屡禁不止，且具有数量多、范围广、分散性强的特点，对于版权权利人来说，如果通过传统的人工排查方式进行侵权监测，成本过高且效率太低。于是，以网络“爬虫”为主要技术的各类全网维权监测平台应运而生，通过网络“爬虫”对全网数据进行抓取、比对，能够迅速筛查出侵权内容，满足广大版权权利人对版权资产保护及维权的需求，在这种场景下，数据的抓取和利用就具有正当性，不构成不正当竞争。

2. 公共利益目的

当“爬虫”平台具有公益性或具有公共基础设施的性质时，应当允许“爬虫”平台进行数据抓取。美国与欧盟等地区认为，即使对于受版权保护的信息与数据，搜索引擎对其的数据抓取行为也属于合理使用的范围。为避免超级网络平台收集海量数据后形成数据垄断，应当更多允许第三方的数据“爬虫”抓取原始数据或基础数据，进行数据的合理使用，从而实现数据共享与数据的普惠性。^[7]

3. 不公开使用

如果数据“爬虫”抓取公开数据之后不公开使用，也不构成不正当竞争。因为被抓取内容不会出现在抓取方的平台中，用户也不会从抓取方的平台访问、获取到被抓取内容，抓取方不会因为抓取行为获得不正当利益，这种抓取行为是正当的。

全网维权监测平台的合法数据抓取与共享

相关推荐