首页 理论教育智能新闻著作权问题的理论与案例分析

智能新闻著作权问题的理论与案例分析

【摘要】:另一方面是智能新闻作品样态呈多样化发展。此阶段智能新闻的数量急剧增多,侵权案件频出。2019年4月25日,我国首个涉及智能生成内容著作权的案件宣布判决结果。智能新闻作为智能生成内容的一种具体形态,其引发的版权纠纷正由单向的侵权变为双向的侵权和被侵权。明确法定主体的性质是智能新闻版权规制的逻辑起点。

智能新闻是指通过算法对海量数据进行排序、分类、关联和过滤,并将整理过的数据进行适配和组合,再放进相应的文章模板之中而形成的新闻作品。智能新闻最早出现在美国。2015年9月,腾讯的Dreamwriter在国内发布首篇机器人撰写的新闻《8月CPI涨2%创12个新高》。自此,以人工智能(AI)技术为支撑的智能新闻开始在我国的新闻行业中不断更新换代,为新闻产业赋能。与此同时,与智能新闻相关的版权纠纷也越来越多,版权问题成为当前智能新闻研究的焦点。2019年8月26日,新华智云发布了自主研发的25款媒体机器人,人工智能在新闻生产领域的应用逐渐朝着纵深方向发展,呈现出分工精细化的趋势,人工与AI技术开始融合,“人机协同”成为智能新闻生产过程中人与物的关系模式。从人与物的关系角度入手规制智能新闻引发的版权纠纷,有利于规范智能新闻生产秩序,推动智能新闻健康发展。

一、智能新闻在我国的发展及版权问题的凸显

智能新闻之所以“智能”,取决于两个方面:一是算法,对数据进行适配和组合的计算机程序——技术模型;二是大数据,它为算法提供原始素材。依据智能新闻生产过程中人对算法和大数据的介入情况以及相对应的人和技术的关系模式,智能新闻在我国的发展经历了以下几个阶段,版权问题日益凸显。

第一个阶段是第一代写作机器人阶段。以新华社的快笔小新、腾讯的Dreamwriter和第一财经的DT稿王为代表。这个阶段的生产方式大致为经过数据采集,并将其录入数据库,通过技术手段短时间内选出新闻点并抓取相关资料,在设定的新闻模板上生成新闻。这个阶段不论大数据方面还是算法方面,新闻从业者都较难参与其中,属于机器主宰期,被称为“狼来了”的时期。这一时期的版权纠纷主要是机器人新闻对传统新闻的版权侵权。

第二个阶段从第二代写作机器人开始至分工机器人出现。随着大数据技术的发展以及其在新闻领域应用的深入,人工对AI技术的可控性加强,人机关系变为“合作模式”。一方面是人工对智能新闻原材料——“媒资”的收集和控制能力加强,如今日头条的写作机器人——张小明在里约奥运会上对接的数据库是奥组委的数据库。确定的数据输入,可在一定程度上控制数据输出。另一方面是智能新闻作品样态呈多样化发展。智能新闻作品从文字稿件逐渐扩展到图片、视频、语音、数据可视化等方面。此阶段智能新闻的数量急剧增多,侵权案件频出。

第三个阶段是传统中央主流新闻媒体开始参与到算法的开发阵营,对算法模型进行干预。人工智能技术与行业需要更加贴合,算法模型朝着分工细化方向发展,人机开始互动、融合、优势互补,形成协同关系。这一阶段的到来以2019年8月26日新华社和阿里巴巴共同成立的新华智云发布自主研发的25款媒体机器人为标志。媒体机器人在智能新闻生产过程中的主要作用是替代人工的重复性劳动、提高精准度和提升生产效率。人工在智能新闻的生产过程中处于主导地位,不仅可以对输入数据进行把控,也可以按照行业标准对算法的逻辑和应用范围进行干预。这种人与物的关系模式,不仅解决了媒体人在新闻“采集”和“处理”中的痛点,也为之前大量出现的智能新闻的版权纠纷提供了规制的新路径。

二、智能新闻版权规制的症结

就智能新闻的版权纠纷而言,原材料数据——“媒资”侵权、“算法”模型的侵权和被侵权是引发版权纠纷的主要症结。

1.作为智能新闻原材料的数据——“媒资”侵权

“算法”进行新闻写作和编排的第一步就是从数据库中抓取新闻素材。因此,对于“媒资”版权的识别是此环节是否会引发侵权的关键。“媒资”侵权主要表现在两个方面:一是对已发表的新闻作品的侵权。新闻作品的公开性的特点使得抓取方便快捷,再加上不拥有著作权的单纯事实信息与拥有著作权的其他新闻作品的界限模糊,侵权纠纷出现较多。二是因我国著作权集体管理“信任机制”不完善造成版权登记不完全,这些未登记版权的新闻作品成为算法进行版权识别的盲区。目前,在我国由于著作权人对著作权集体管理和集体管理组织的不信任,导致版权登记率较低。拥有版权的新闻作品因没有进行版权登记无法被算法识别,这是版权登记方面存在的问题在智能新闻侵权问题上的直接反映。

2.智能新闻的“算法”模型侵权

在新闻制作环节,新闻从业人员对采访获取的素材进行选择、编排、搭配、组合等都是按照新闻规律进行。这种编排作为新闻内容的重要组成部分,直接影响新闻的真实性、时效性,是新闻价值得以体现的重要方面,这被称为新闻作品的编排逻辑。编排逻辑作为新闻工作者思想的具体表达形式是新闻作品版权客体的真正内核。智能新闻的编排逻辑由“算法”模型决定,其形成主要依靠深度学习传统新闻作品的编排逻辑。在智能新闻发展的前两个阶段,“算法”的开发主体主要是计算机科技公司。一方面,这些主体因其自身在新闻专业方面的局限性,很难保障算法编排逻辑的合法性和合规性,甚至有些超级算法,通过自身的算法模型处理数据,其过程完全不受人工控制。另一方面,因算法逻辑的复杂性和计算机技术的专业门槛,算法内在的逻辑具有不透明性的特点,使用“算法”模型的新闻机构也难以干预。因此,基于算法逻辑生产出来的智能新闻侵权发生后,判定难,确责更难,这是智能新闻版权规制的另一症结。(www.chuimin.cn)

3.“算法”被侵权

“算法”作为智能新闻作品的主要生产要素,如被侵权会引发智能新闻作品被侵权。2017年5月,微软开发的人工智能机器人小冰独立创作了诗集《阳光失了玻璃窗》。不久,掌阅科技就盗用了该诗集的版权,在App上进行自主发布。2019年4月25日,我国首个涉及智能生成内容著作权的案件宣布判决结果。智能新闻作为智能生成内容的一种具体形态,其引发的版权纠纷正由单向的侵权变为双向的侵权和被侵权。如何保护“算法”的知识产权是规制智能新闻版权的又一症结,也是智能新闻能否健康发展的关键。

三、智能新闻的版权主客体认定需与《著作权法》规定一致

厘清版权纠纷的前提是明确权利主体的性质。2020年的《著作权法修正案(草案)》第二条规定著作权的享有主体为“中国自然人、法人或者非法人组织”。明确法定主体的性质是智能新闻版权规制的逻辑起点。将智能新闻与传统新闻相对照可以看出,智能新闻在版权规制方面的焦点是署名权、财产权以及财产相关的邻接权由谁享有,侵权后的责任由谁承担等问题。之前的研究把主体落脚到“算法”上的提法与基本的法律规定冲突,是行不通的。而落脚到计算机科技公司,因其难以用新闻专业的职业规范进行约束,在侵权责任的承担方面出现了许多现实的困难。“人机协同”关系模式下,新闻从业者的主导性加强、权重加大的同时,也为义务承担提供了合理的主体。

《著作权法》中规定了版权的客体“是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果”。按照世界贸易组织《与贸易相关的知识产权协定》和《世界知识产权组织版权公约》坚持的“思想——表达”两分法原则,版权保护延及表达,而不延及思想。在智能新闻的版权纠纷中,不论是对传统新闻作品的侵权,还是作为自身版权客体的实际内核,“媒资”和“算法”都是决定因素。因此从“媒资”和“算法”两方面加强人的主导性,是智能新闻版权规制的必由之路。

四、相关法律的完善与市场的调适

1.与时俱进,完善既有法律是智能新闻版权规制的法律依据

作为成文法法系的国家,在智能新闻的版权纠纷中,法律作为基本的强制手段,具有不可替代的规范作用。一是“时事新闻”的版权需本土化、具体化、体现时代性。2020年《著作权法修正案(草案)》中将“时事新闻”修改为“单纯事实消息”,有利于将纯事实性新闻与其他新闻报道相区分,从法律上明确智能新闻“媒资”中相关内容的版权情况。版权登记方面,版权管理体制的逐步优化和区块链技术的发展,也使版权登记率逐步提升,在版权识别方面为智能新闻提供了便利。“人机协同”背景下,智能新闻从业者可以法律和版权登记记录为依据对“媒资”数据进行干预,最大程度防止侵权。二是与智能新闻相关的权利问题需要法律条款明确界定。《著作权法》对智能新闻的署名权、财产权以及相关的邻接权等的明确,《知识产权法》对“算法”的知识产权的保护,以及相关行业法规对新闻聚合平台的性质的界定和准入标准的制定等都是指引各方主体规范行为、厘清纠纷的依据。2019年3月26日,欧盟《数字版权指令》在经过多方的博弈后最终通过,其中关于“链接税”条款(acts of hypelinking)和“过滤器”条款的相关内容对我国版权立法具有借鉴意义。

2.运用市场规律或可成为版权规制的新思路

传统媒体作为党和国家的新闻事业的性质不同,AI技术作为工具既可以为传统新闻媒体所使用,也可以为商业属性的新媒体公司甚至自媒体所使用。商业性质的市场主体,趋利性是其本质属性。利用市场杠杆进行调控作为法律的有效补充方式,是在市场经济环境下必须遵守的基本规律。一方面调整智能新闻中AI技术开发者的准入门槛。利用市场杠杆,将智能新闻AI技术开发者的身份特征与新闻内容的信度和效度建立关联,通过新闻受众的自主选择提升AI技术的专业门槛。另一方面调整新闻聚合平台与传统媒体的利益。版权纠纷的背后,其焦点是利益的平衡。运用《反不正当竞争法》从利益平衡的角度进行调控,可以避开难以明确规定的新媒体公司的合法、合规性问题,直接运用市场规律进行调节,这样既能对传统新闻的利益进行补偿,也不会损害新技术带来的提升表达自由方面的积极作用。