首页 理论教育大数据在新媒体内容运营中的作用

大数据在新媒体内容运营中的作用

【摘要】:在我们研究新媒体的内容运营时,首先要对几个常见的概念做一个基本的区隔,也就是内容、业务和产品。事实上,传统媒体中的信息传播流程即可对这种媒体内容生产和运营的过程做出解释。经过长期经营和管理实践的探索,目前,新媒体已经形成了较为完善的内容运营流程,以平台化的模式对内容的生产传播进行了流程再造。此外,新媒体机构在内容运营的过程中有一个极为重要的特点,就是将内容视为产品。

在我们研究新媒体的内容运营时,首先要对几个常见的概念做一个基本的区隔,也就是内容、业务和产品。

“内容”是媒介运营的核心要素,是指以媒介为传输载体的各类信息形态的总称。从文化学的角度出发,“内容”这一概念的主要意义在于容纳,内容指的是一种能够把外在包容其内的状态。从传播学的角度出发,传播者、信息媒介、接收者和反馈是传播的五个核心要素。从媒介产业的角度出发,内容是媒介产业链条中重要的环节,和传输环节、经营环节、终端环节等同样重要。内容资源是媒体联系受众、经营广告的基础要素。

从数字新媒体运营的角度出发,内容是能够承载和传播信息的专业技术平台和软硬件上所承载的信息形态的总称。快速发展的数字技术造就了快速、通畅的传输网络,形成了强大的信息处理能力,对信息内容的处理更快、更便捷。具体来看,新媒体的内容包括文字、图片、音频、视频等。

“业务”是指媒体基于现实的内容,考虑内容与用户或者广告主需求之间的关系,所规划出来的方便使用的各种外在的信息服务的表现形式。从字面意义来看,业务是指个人的工作职业或者机构的专业服务项目,其解释有两个核心点:第一是专业性,能称为业务的,一般都是某个领域的专业性工作;第二是事务性的具体项目,指这些专业性的工作所包含的有着特殊知识技能和要求的具体项目。

从媒体运营的角度来说,业务是附着在内容和需求之上的,在现实运作中,媒体的运营方往往是以业务形态的规划作为内容和商业模式的设计基础的,而用户也往往是通过媒体提供的业务产品来实际使用和消费媒体的。在传统媒体时代,“业务”的概念还不太强,然而伴随着新媒体技术的发展、用户需求的碎片化、海量内容的出现,媒体的运营需要更多的分类规划和分解传递,媒体内容和用户需求之间的联系需要不同业务形式来构建,业务的重要性才得以凸显。

“产品”是指媒介根据市场的需求所生产的,能满足媒介消费者需求的产品和服务。在经济学的解释中,产品是指能够提供给市场,被人们使用和消费,并能满足人们某种需求的任何东西,包括有形的物品,无形的服务、组织、观念或它们的组合形式。媒体产品的释义其实正是在这个基础上的一种延伸和拓展。新媒体的产品是基于内容和业务所提供的,能够让用户直接接触、使用和消费的,具有可交易性质的形态。

媒体产品作为产品,首先是一种商品,具有使用价值,其价值是通过满足受众的需求来实现的,这是媒体产品的自身要素;其次,媒体产品跟其他产品一样,要实现其价值,必须投放到市场,在市场的指挥下进行流通,这是媒体产品的外部要素。在现实生活中,一部电影、一部电视剧、一个App,都可以称为新媒体的产品,它们的共同点在于可以被用户直接接触并使用,而且可以进行消费。

从信息传播的角度来看,内容是信息的首轮加工产品,也是媒体“传播”的对象,是媒体产品、媒体业务的重要基础与核心。产品有更深一层的加工含义,并且通常被赋予“消费”“交易”的含义。在针对消费者或者受众、用户时,业务和产品的意义有时可以通用。但是从媒体运营的角度来看,业务的范畴更大,同一业务下可以包含多种产品,而“业务”的承载和表现往往都是产品。例如:××媒体机构在进入××业务领域后,推出了××产品。但是,从严格意义上来说,三者的概念是不同的,在研究新媒体时,通常需要对这三个概念进行差别化运用。

在传统媒体时代,媒体的内容生产过程相对较为简单,而新媒体给整个信息传播环境带来了极大的改变,也重构了内容运营的流程。在这个过程中,数据扮演着越来越重要的角色。

在传统媒体的内容运营流程中,媒体机构负责对信息进行加工整理,形成内容产品之后,通过各自的信息传播渠道将内容产品分发给不同的受众。受众在接收信息之后通过一定的方式向内容产品的提供者进行反馈,媒体再根据受众反馈进行下一次内容生产的调整,这就完成了一次内容生产、分发、消费的过程。事实上,传统媒体中的信息传播流程即可对这种媒体内容生产和运营的过程做出解释。唐·E.舒尔茨(Don E.Schultz)在他的《全球整合营销》中,为依托传统大众媒介建立起来的营销传播做了一个模型图。在图中,舒尔茨清晰地标明了信息流动的方向,即从信源流向信宿,基本保持线性的流动。而消费者在营销传播中处理信息的方式也是线性的,表现为接触→注意→理解→接受→保留。

经过长期经营和管理实践的探索,目前,新媒体已经形成了较为完善的内容运营流程,以平台化的模式对内容的生产传播进行了流程再造。

首先,新媒体的内容运营需要经过内容获取、集成、分发三个重要环节。新媒体通过各种渠道广泛吸纳海量内容,新媒体机构对各种内容进行集成,使之成为符合市场需求的内容产品,并面向多种终端和用户进行传输分发。在各个环节中,新媒体内容运营均体现了多元化、多样性、开放式的特点,使之有别于传统媒体封闭式、单一化的管理模式。

其次,新媒体的内容运营还有两个重要支撑:一是内容监管,即内容的可管可控,通过遴选和监控保证内容的安全可靠。二是媒体资产管理系统的建设。媒体资产管理系统在新媒体内容管理过程中的作用至关重要,新媒体的内容管理流程千头万绪,需有更科学的管理系统来保证资源的合理配置。同时,原始的内容资源通过媒体资产管理系统的配套之后可以进行多次开发,深度发掘内容资产的价值。

此外,新媒体机构在内容运营的过程中有一个极为重要的特点,就是将内容视为产品。互联网产品其实并未创造出全新的生产机制,只是更加灵活地根据用户反馈进行产品调整。虽然这种不断获取反馈再不断调整的方式并不一定都会采用最新的手段与方法——大数据和小数据、中数据的结合使用是常态。但是在这方面,传统媒体工业化的程度依然有所欠缺,究其原因主要是产品意识不强。

正如前文所述,新媒体的内容运营流程可以分为基本的内容获取、内容集成、内容分发和交易三个大的环节。无论具体的内容产品是什么,总结来看,媒体进行内容生产的最终目的是搭建起恰当的商业模式,从而实现盈利。

目前,用户付费、商业广告、内容销售是最常见的三种模式。所以,对于内容运营这项工作来说,大数据的作用是要从这三个层面来提升新媒体机构的盈利能力。在传统的媒体内容生产过程中,数据最重要的作用就是从用户与广告主的需求角度出发,为内容生产者提供必要的参考和借鉴。然而在大数据技术的支持下,数据的作用和重要程度都发生了改变,也在颠覆原有的媒体内容生产的模式。在运营过程的各个环节中,大数据都可以参与其中,并且有效地提升新媒体机构内容运营的效率优化运营效果。

第一,在内容获取方面,不管是自主内容生产还是外部引入,即通过购买、合作的方式获得内容,都需要利用数据对其进行评估,从而生产、获取更加符合市场需求的内容产品,甚至数据本身都可以成为优质的内容。第二,在内容集成环节上,新媒体机构要实现的是内容的业务化和产品化,在这个过程中,需要根据终端、渠道、受众的不同,将原始内容加工整理成更加合适的内容产品。大数据的指导作用同样重要,在这个过程中,可以利用数据的支持对内容产品进行优化,通过编辑整理让内容产生更大的价值。第三,在内容分发环节上,如何让不同的用户在不同的时间,利用不同的终端接收最合适的内容产品,并且让新媒体机构在第一时间获取用户的评价与反馈,这是大数据需要解决的重要问题。实现精准的推荐和个性化的分发模式是现在新媒体机构在内容分发层面上的工作重点。

帮助新媒体预知用户、受众的需求,提前生产出符合他们需求的内容及产品,同时进行内容产品的优化,并且帮助媒体用更加合适的方法去传播和营销,这是大数据在新媒体内容运营中的重要使命。

根据业界的认知,数据新闻又叫数据驱动新闻,是指基于数据的抓取、挖掘、统计分析可视化呈现的新型新闻报道方式。数据新闻是在大数据的技术背景下产生的,数据新闻是随着数据时代的到来出现的一种新型报道形态,是数据技术对新闻业全面渗透的必然结果,它的出现在一定程度上改变了传统新闻的生产流程。

精确新闻学理论亦被称为精确新闻体、精确新闻报道,是由美国学者、新闻记者菲利普·迈耶(Philip Meyer)在20世纪60年代提出来的。在《精确新闻报道:记者应掌握的社会科学研究方法》一书中,菲利普·迈耶将精确新闻的含义界定为:记者在采访时,运用调查、实验和内容分析等社会科学研究方法来收集资料、查证事实,从而报道新闻。

在当时的时代背景和环境下,新闻业界希望能够以更加精确的数据、概念来分析新闻事件,尽可能避免主观的、人为的错误,使新闻报道更加客观、公正,所以民意调查研究成为当时精确新闻学的最主要的组成部分。随着民意调查的日益发展与多样化、细化,以及新闻教育变革和新闻传播技术的发展,特别是电话的普及和电子计算机的广泛使用,精确新闻报道日益成熟。

精确新闻报道使记者在采访时能运用科学的方法进行直接或间接的系统观察,这就使这种观察具有代表性,而且在内容上它是以严肃的数据为依据的,可以使新闻报道更加客观公正。传统的新闻报道是记者被动地报道或解释新闻事件,新闻报道被狭隘地限制在“对新闻事件的报道可解释”上。精确新闻报道的出现,使记者能采用系统的科学方法,主动采集、加工资料,挖掘隐藏的真实信息。从这些关于精确新闻报道的阐释中可以看出,人们很早就开始探讨如何使新闻报道更加精确和客观,尤其是如何将数据与新闻报道结合在一起。

在这之后,新闻报道与数据之间的距离不断被拉近。20世纪90年代,随着计算机技术的普及,“计算机辅助新闻(Computer Assisted Journalism)”在新闻调查与新闻报道中的比例日益增加,这进一步提升了新闻报道的精确性。之后,“数据库新闻”等概念出现,新闻报道从生产方式到报道形态都发生了巨大的变革。21世纪初,记者们开始尝试从一些数据库中找出有用的数据,以便挖掘新闻专题。这些数据库既包括政府公开的数据库,也包括媒体自己的数据库。不久之后,数据驱动新闻、大数据新闻等概念以及操作方法应运而生。显然,这一过程与人类的数据处理技术的进步是同时发生的。

关于数据新闻概念的诞生,业界和学界目前并无统一的判断,但是仍有一些标志性的事件可以帮助我们更好地了解数据新闻的发展过程。例如,澳门科技大学章戈浩教授认为,第一个利用数据进行的新闻报道可以追溯到1821年5月5日,那是《卫报》首期报纸的头版新闻:曼彻斯特在校小学生人数及其平均消费。现在还可以从《卫报》的网站上下载到这份原版的PDF文件。方洁在《数据新闻概论》一书中则表示,率先提出“数据新闻”概念的是《华盛顿邮报》的软件开发员兼Every Block网站的创建人阿德里安·哈罗瓦提(Adrian Holovaty)。他在2006年的一个论坛中做了名为《报纸网站变革的一种基本方法》的演讲。在这场演讲中,他虽然没有直接给出“数据新闻”这个概念,但是已经提出了相关理念,因而被业界认为是数据新闻的创立者。我们可以看出,数据新闻的诞生与数据在新闻报道中的应用息息相关,但是数据新闻绝不简单地等于使用了数据的新闻报道。因此,我们有必要对数据新闻的基本概念做一个简要的界定。

目前学界和业界对于“数据新闻”还没有形成统一的认知,所以在对数据新闻的概念进行解释的时候,会出现一定的差异。总结来看,学界与业界对于数据新闻有一个共同的认知,即数据新闻是一种运用了数据理念的、全面变革了的新闻报道方式与制作手段。

例如,美国伯明翰城市大学的教授保罗·布拉德肖认为,数据新闻就是一切用数据处理过了的新闻,数据新闻的制作过程可以用倒金字塔来表示,包括数据汇编(Compile)、数据清理(Clean)、数据了解(Context)和数据整合(Combine)四个部分;数据新闻的传播过程通过正金字塔来完成,包括可视化处理、叙述新闻故事、通过社交媒体发布、受众根据自身的需要和兴趣有选择地使用。

在整个过程中,数据处理的最终目的是完成数据的可视化并实现有效传播。这个金字塔的解释图在学术界广为流传。我国香港城市大学的祝建华教授认为,数据新闻是用来过滤和分析海量新闻数据的工具,它通过对数据的整合,实现对新闻的挖掘。

在业界,对于数据新闻概念的讨论也有很多。《卫报》《纽约时报》和《华盛顿邮报》等数据新闻的实践者都提出了对于数据新闻的自我认知。例如,《卫报》数据新闻编辑西蒙·罗格斯(Simon Rogers)认为:“数据新闻不是图形或可视化效果,而是用最好的方式去讲述故事,只是有时故事是用可视化效果或地图来讲述的。”

数据新闻与精确新闻的差异主要体现在三个方面。第一,分析和处理的数量有着显著差异;第二,数据对于精确新闻来说是一种辅助,但是对于数据新闻而言则是核心驱动力;第三,在承载平台方面,精确新闻基本还是以传统媒体为介质,而数据新闻主要利用的则是数字化媒体平台。如果从数据新闻与传统新闻报道的差异点来看的话,数据新闻被认为是通过数据处理来进行的新闻报道,极为强调新闻报道与数据之间的关系。

从数据新闻对新闻叙事的创新的角度来看,数据新闻是一套囊括了许许多多的用于新闻叙事的工具、技巧与方法,为了提供更加生动、鲜明的阅读体验的新闻报道生产方法。从工作流程与方式的角度来看,数据新闻应当是一种全新的工作流程,包括抓取数据、挖掘数据、数据可视化等基本步骤,在这个过程中实现数据与新闻信息的融合。

在学界与业界共同探讨数据新闻的过程中,《数据新闻手册》一书诞生了。该书的编写始于2011年伦敦Mozilla festival的一个48小时工作坊。该书由欧洲新闻学中心(European Journalism Centre)和开放知识基金会(Open Knowledge Foundation)共同倡导,来自BBC、《卫报》《金融时报》和《纽约时报》等多家媒体的专注于数据新闻领域的业界和学界人士通过网络协作方式完成编写。2013年经欧洲新闻学中心授权,《数据新闻手册》中文版由30人的专业团队志愿翻译成稿,并由香港大学JMSC进行质量审核。该书对于数据新闻的概念界定为:简单来说就是用数据报道新闻。它为记者将传统新闻敏感、引人入胜的叙事能力与规模庞大的数字信息结合起来提供了可能。

我们以数据新闻为例,探讨了大数据给新媒体内容生产带来的影响与改变。当然,除了数据新闻之外,大数据也被广泛地运用在各种类型的内容生产当中,视频、文字、图片、音乐均在其中,我国的媒体机构也在积极地尝试运用大数据的力量来优化自身的内容生产。

只要运用得当、表现得当,数据可以直接转化成媒体的内容产品。采集数据成为内容生产中的重要步骤,如何去组织和表现这些数据成为内容生产者的重要使命。例如,2015年10月,国内首个大型数据新闻节目《数说命运共同体》在中央电视台《新闻联播》《朝闻天下》《新闻30分》《新闻直播间》等多个新闻栏目推出。该节目由央视新闻中心跨行业、跨领域整合多方信息源,依托国家“一带一路”数据中心、国家统计局、海关总署、世界银行、世界贸易组织的权威数据库,动用两台超级计算机,历时6个月完成。此外,该栏目还首次使用卫星定位跟踪系统数据,通过大量GPS移动轨迹,提升数据新闻的视觉表达效果;首次使用数据库对接可视化工具,使节目通过真实数据轨迹进行全景呈现。据了解,《数说命运共同体》单是挖掘数据就超过1亿GB,仅为计算“全球30万艘大型货船轨迹”而分析比对的航运数据GPS路径就超过120亿行。

数据赋予新媒体内容生产的另一项变革在于内容生产者的改变。一方面是传统的“生产者”与“使用者”的界限变得模糊;另一方面是人工智能越来越多地参与到内容生产当中。大数据的4V特征强调的就是数据量大、来源丰富、种类多样且速度迅疾,那么,利用大数据进行的媒体内容生产也理当符合这样的特征。这就在客观上要求内容提供者能够以“集成者”和“平台”的理念对自身进行重新定位。

网络媒体的内容生产很多时候是各种分散主体的协同式“分布生产”,众包新闻就是这种变化的典型模式。此外,在豆瓣、知乎、微博、脸书和推特等社交媒体上,用户看到的内容本身就来自各种个体、群体、机构的“讨论”与评述,这些信息往往又成为主流媒体进行内容生产的重要源头——专业媒体机构不但利用这些信息进行数据新闻的生产,而且也将它们视为重要的新闻报道的素材

例如,从2007年7月开始,《赫芬顿邮报》启动了名为“Off The Bus”的公民新闻项目,在普通民众中招募大量志愿者共同参与总统大选的报道。其基本形式是:OTB网站将采访需要提出的问题、需采集的信息等预先设计成表格,分发给参与的志愿者,他们完成采访后将填好的表格信息发回网站,编辑根据其内容编发成新闻消息或存入资料库。这种“分布式”新闻报道方式的优势是由于参与者众多,能以群体力量完成时间、空间跨度较大的事件的跟踪采访和报道,并且能唤起普通民众对公共事务的兴趣,从中发掘出内容鲜活、能产生重大影响的新闻。

众包网站MicroM Appers的创立旨在以众包的形式协助联合国及其他援助机构完成工作,网站的合作伙伴包括联合国人道主义事务协调办公室和Standby Task Force(一个类似依靠数字志愿者协助解决人道主义援助问题的众包网站)。MicroM Appers在受灾当地和联合国救援组织之间扮演着中间人的角色。网站接收来自数字志愿者发来的信息,发送者可以根据网站的“Clickers”点击分类功能选择信息的类型,包括呼吁救援、受伤信息、警告信息、提供援助、基础设施受损或其他。网站通过发送者的选择,迅速对数据进行分类处理,并将这些数据定位到一幅不断更新的地图上,同时将实时更新的数据发送给联合国救援组织。在2013年的巴基斯坦地震、2014年的智利地震、马航370事件中,MicroM Appers都发挥了突出的作用。例如,2014年12月,超强台风“黑格比”袭击菲律宾,该网站收到了约700个数字志愿者发来的即时信息,其中包括50394条来自推特的文本信息和33377张现场照片,网站对这些数据进行核实后分别以地图的形式发布了集纳了文本数据和照片数据的地图,并保持数据的实时更新。

在当前的趋势下,数据对于内容生产的指导作用被极度放大。媒体机构对于用户需求的了解会先于内容生产,以用户为中心的内容生产观念在大数据技术的支持下被全面放大。例如,《赫芬顿邮报》利用自身的核心算法和人工处理方式紧盯谷歌搜索上的热门词汇,根据最热的新闻词汇进行相关内容的编写并发布,从而为用户提供他们最希望看到的新闻内容。《赫芬顿邮报》不是根据自己的生产能力来制作内容,而是根据用户的需要对已有新闻进行整合,从而最大可能地满足读者的需求。我国的“今日头条”通过对人民网、新华网、网易、新浪等各大新闻网站的新闻进行内容聚合,基于“推荐”“热门”“好友动态”三个维度,向用户推送资讯、评论等内容。

在传统的影视剧创作过程中,决定拍摄题材的是编剧和导演。大数据则提供了用数据选择题材的可能性。Netflix通过对3000万用户的收视选择、400万条评论和300万次主题搜索等数据的深度分析,发现政治剧是当下美国观众迫切需要的,所以投资1亿美元翻拍了《纸牌屋》并且一炮而红。这个案例已经成为大数据指导影视剧生产的经典范本。

在国内,新媒体机构同样在积极探索如何将大数据运用于内容生产当中。例如,乐视网通过对用户进行调研发现,有超过70%的用户喜欢看宫斗题材的电视剧,其中最关注“权力斗争”内容的用户达到40%。这项调查促使乐视决定拍摄自制剧《光环之后》。优酷的自制剧《嘻哈四重奏》制作团队通过对用户习惯数据进行分析发现,观众在第一季中对“偷菜”游戏的评论频次特别高,所以在后来的剧情中,加入了《愤怒的小鸟》《植物大战僵尸》等流行游戏。(www.chuimin.cn)

目前主流的新媒体机构在内容价值的实现上主要有三种方式,具体来看的话,第一种是将内容销售给用户,包括个人用户与机构用户,然后获取一定的收入,从而体现出内容的价值。按照通常的理解,视频网站的用户付费形式就是这种内容价值体现方式的代表。第二种是合理设计内容播出过程中的各种品牌曝光机会,即广告产品,并将其销售给广告主从而获取广告收入。无论是硬广告还是软广告,都是这种内容价值的重要实现方式。第三种就是将内容的不同版权产品销售给其他媒体机构或者播出平台,从而获得相应的版权收入。为了获得更高的盈利,最大限度地实现内容的价值,新媒体机构除了需要提升内容本身的质量、提高其吸引力之外,还需要通过各种各样的包装方式、营销手段去进一步提升自身内容产品的价值,从而获取更大的收益,这就是我们所说的内容运营过程。具体来说,“运营”的概念包括内容的编辑、推荐和销售三个方面。

与传统媒体相比,新媒体的内容运营模式是有着鲜明特色的。中国传媒大学周艳教授认为,以互联网为代表的新媒体机构在内容运营方面经历了不同的发展阶段。第一阶段是较为粗放的内容运营模式:“广播式媒体通过自制或者采购、合作等方式,获得优质的内容,并且按照用户需求的种类、时间、区域差异等将其编排并分发出去。而互联网媒体的内容运营因为一开始就不是构建在自制内容基础上的,没有独立的采编权,其在内容运作上是对传统媒体数十年内容沉淀的‘盘剥’和‘压榨’。互联网媒体能够将海量存储内容的多媒体性质呈现给用户,并且主要通过‘标题党’的形式不断创新策划和编排手段,使得原来线性内容被加工整理后更符合互联网用户的使用需求。”

第二阶段则开始运用数据的力量:“在内容缺口和创新压力下、技术支持下,互联网媒体构建了数据库创建内容的运作模式,通过构建强大的数据库并对其进行管理,梳理数据指标之间和不同数据库结构之间的关联。互联网能够把原本零散而没有关联的信息重新组合起来,生产出人们所需要的信息内容,于是其内容运营的能力得以大幅度提升……在内容营销方面,内容本身的数据、用户的基础数据、用户的信息浏览和使用习惯数据、信息传播过程中产生的交易行为数据等,这些通过传统方式很难得到的数据在互联网上变得非常便捷,数据是透明的、可寻址的,这就使得互联网上的数据库营销更为常见而高效,而且屡见创新。”

在这篇文章中,我们可以看到新媒体在内容编辑整理和内容营销方面的尝试。2012年之后,大数据技术席卷了整个传媒产业,给新媒体的内容运营带来了更加深远的影响。

在新媒体内容的运营过程中,内容被视为“产品”。而被赋予了产品观的内容运营,就会在产品本身质量之外追加更多对“包装”的要求,以便更好地吸引消费者并销售出去。对于用户来说,内容的编辑与推荐就相当于内容产品的包装和铺货,如何利用大数据技术来提升编辑的能力、推荐的精准性、分发的针对性,尤其是适应新媒体环境下受众碎片化和个性化的传播特性,就成为新媒体机构内容运营体系中的重要命题。

互联网的发展带来了信息的大爆炸,对于个人用户来说,可以浏览的信息量过于巨大,不同网站内容中同质化的程度也较高,难以做出选择。对于新媒体机构来说,帮助用户进行信息筛选,同时让自身的内容产品获得竞争优势以吸引用户的注意,这些工作是通过适当的编辑、包装和精准推送来实现的。换个角度来说,即便是同样的内容素材,也会因为不同的加工方式和编辑推荐而产生不同的效果。

所以,我们认为,编辑与推荐过程其实是对内容价值的再次解读与深度挖掘,是新媒体内容运营的重要组成部分。大数据在这项工作中的重要意义就在于帮助新媒体机构提升效率与效果。在视频网站中,YouTube可谓鼻祖。该网站首先将所有内容做了一个基本的划分,包括热门、音乐、体育、游戏、电影、电视节目、新闻、直播、焦点和360视频,共十个频道组。其中音乐、体育和游戏三类由系统自动归类生成。这十个频道组从内容类型、体验类型、热门度等多个角度对视频进行了归类,方便用户进行查找。

另一个能够体现出人工编辑、策划思路的就是新媒体内容的“排序”,首页推荐、置顶、排行榜等都是典型代表。2012年6月,新浪微博推出智能排序功能,用户访问新浪微博时可选择“智能排序”或“更新时间排序”。有网友访问新浪微博时,界面会显示温馨提示:你正通过智能排序的方式浏览微博,智能排序依据你的喜好帮你梳理微博内容。新浪微博客服表示,智能排序是根据用户的关注、标签和微博内容等相关信息来判断用户的喜好,从而进行微博排序的。

Newsmap(新闻地图)是谷歌新闻聚合器上实时新闻反馈的可视化呈现。数据块的大小对应新闻受欢迎的程度。其反映的是谷歌新闻聚合器实时更新的新闻。这种数据可视图基于树状图的算法,适合表现大量信息的聚合。用颜色、标题字号、区块面积等来展现归并后的信息。这种排列方式打破了空间限制,帮助用户快速识别、分类和认知新闻信息,平面而直观地展现不断变化的信息片段。

2011年4月中旬,App Store排行榜上雷打不动的“小鸟家族”突然被脸书等应用挤了下去,由于脸书和“愤怒的小鸟”当时都没有大的程序或营销调整,唯一的解释就是苹果更改了App Store排行榜的算法。脸书从原本的排名第二十位跃升至第一位。据分析,更新算法后,除了应用下载量,用户评价和使用频率也会影响该应用在App Store上的排名。

第三方公司负责8万个应用产品统计的市场部副总裁表示,苹果的确更改了排行榜的统计算法,不再只考虑下载次数。可能是加入了更多的统计方法,如使用频率等来考核App真正的受欢迎程度。除了以上提到的因素之外,如果一款App被下载了100万次,而后来有50万人很快删掉了这个App,那么这样的排行也是不准确的,还是按照使用频率来统计比较好。这种排序的另一个发展方向就是搜索引擎优化(Search Engine Optimization,SEO)。搜索引擎优化是一种利用搜索引擎的搜索规则来提高网站目前在有关搜索引擎内自然排名的方式。在此我们不做详细论述。需要注意的是,以目前的技术现实来看,短期内完全用数据和人工智能来进行内容编辑是不现实的,人工编辑的形式仍然是主流,大数据起到的是辅助性的作用。

在进行合理的内容编辑之后,第二步是需要用到更多数据的推荐工作。除了用户可自主进行频道订阅以外,新媒体机构还会进行相应的推荐。为了提升这种推荐行为的精准程度,新媒体机构需要搜集大量的用户行为数据,以准确判断用户的偏好和倾向。一个简单的例子是,用户在视频网站观看视频之后,网站通常会有相应的内容推荐,比如同一导演、演员的其他作品,相似主题的作品等,用户点击越多证明推荐越成功,这种推荐就是依靠大数据来实现的。

在视频推荐方面,YouTube拥有独特的推荐算法,并在2013年获得了技术艾美奖。YouTube从2008年起向用户推荐相关视频,用户可以在主页或者视频播放页面的右侧看到推荐视频。2008年年底,推荐算法为YouTube每天增加了数十万小时的观看时长,如今这个数字已经达到了数百万小时。YouTube发现,基于用户所观看的一个视频来推荐最相关的视频反而会把用户“吓跑”。“如果我们把算法设计成始终推荐最相关的视频的话,用户很快就会感到厌倦。”YouTube负责算法的软件工程师赫克托·易(Hector Yee)在接受采访时说,“用户喜欢观看不同话题的视频。”有时候,用户愿意点击的“相关视频”实际上是“毫不相关”的。

YouTube发现,如果要根据个人兴趣来推荐个性化的内容,用户更喜欢连续观看不同题材的视频。换句话说,用户并不需要YouTube推荐与当前观看的视频绝对相关的视频,他们更希望看到自己感兴趣的不同题材的内容。

从数据中,YouTube获得了清晰的推荐依据,包括用户的使用行为、使用时机等,比如什么时候用户会点赞,哪些视频他们会从头到尾地观看。总的来说,YouTube追踪全网用户的观看行为并进行记录,用数据构建了一幅访问者可能会点击内容的图画,以此为当前观看视频的每个用户推荐其可能感兴趣的视频。

通过数据分析,视频网站的用户大体可以分为两类,一部分有明确收看的目的,对于这部分用户,视频网站要做的是帮助用户减少观看过程中的操作动作,让他们能够快速找到想要收看的内容;另外一部分用户没有明确的收看目的,所以要根据数据为他们进行合理的内容推荐。美国在线视频网站Hulu针对第一种用户设计了一些数据产品,比如“Show You Watch”,这个产品可以把内容按照用户的最后一次观看时间进行排序,而且还通过数据分析形成机器学习模型进行排序,参考指标包括用户所收看剧集的播出时间、当前平台等信息。

比如,《破产姐妹》是每周二更新,那么当这个用户在下周二登录时,“Show You Watch”就会为用户自动推送最新一集的《破产姐妹》。此外还有“Show SmartStart”,就是用户进入剧集页面之后会直接进入上一次所观看的集数,不需要重新搜索。短视频会推荐相同主题的视频的产品。这些产品共同帮助用户提升观看体验。

对于第二种用户,Hulu设计了个性化的推荐首页,进行智能推荐,在推送之后还以小调查的形式了解用户对这个推荐的反馈意见,以便下一次更加精准地推荐。

另一个案例是我国的今日头条。目前几乎所有主流的新闻资讯App都会打出个性化推荐的旗号,然而他们的做法主要是让用户自己勾选,鲜有足够优质的算法来支撑。今日头条则不同,它凭借其核心的算法,可以做到较为准确的自动推荐。其中有两个最重要的机制,一个被称为“冷启动”,一个被称作算法的驯化。

冷启动是指用户在第一次使用所绑定的社交账户登录今日头条客户端时,今日头条通过对用户社交数据的挖掘,包括根据好友关系、兴趣所在、历史数据而形成的多个分析模型等,为使用者建立DNA兴趣图谱,这一过程用时只需5秒。从用户第二次使用今日头条开始,就进入到算法的驯化阶段。随着用户使用频率的增加,用户的DNA兴趣图谱会有所变化。今日头条不断地对用户的浏览、收藏、转发、评论等行为进行学习和分析,再结合其阅读习惯、阅读时间、阅读位置等多个维度,不断增加其属性。除人群属性外,算法还会对文章打标签,包括发布时间、文中出现的名人、发布文章的区域等。而今日头条最终要做的就是“推荐”。

但是,一个人会归属于多个人群,一篇文章也会有多个标签,因此必然会有多篇文章推荐给这个用户,如何确定推荐顺序呢?今日头条的推荐算法的核心原理是让用户对文章进行投票,并把得票率最高的文章推荐给相同的人群。推荐能够满足的是用户的个性化需求,而实际上,并非用户的所有阅读兴趣都能够被算法所洞悉满足。有一些共性的需求,用算法来解决不如用频道运营的方式来实现效率更高。因此,今日头条还会让机器将内容分成各种版块,让用户订阅。

新媒体传播的一个特性就是速度迅捷。在内容生产方面,大数据等技术的出现使得抓取、编辑、整理的速度不断提升,新媒体机构在生产和集成内容的同时,也作为其他媒体机构的内容源而存在。所以,在内容集成的同时,内容分发也在发生。因此,利用数据技术优化分发与传播路径,同样是新媒体机构内容运营的一个要点。

通常来看,如果想要优化分发与传播的效果,要注意以下几点:

第一,必须对不同媒体、不同终端的用户的行为偏好有充分的了解。以视频产品为例,电视端更适合播放长视频以及画面精良的视频内容,手机等移动终端多半用来满足用户碎片化时间的信息获取需求,所以视频内容宜简短;在一天的不同时间段里,用户对于视频内容的类型的需求也会存在差异,新闻类、娱乐类、科技类、生活类不一而足;不同的用户群体对于视频内容的类型和特征也会存在需求的差异点。针对这些特点,内容生产者在将内容分发至不同的媒体类型以及终端类型时,应对用户行为、需求数据有充分的了解。

第二,对于下游的传播路径也应当有一定的了解,以便掌控整个内容传播的过程,从而提出相应的优化方案与问题解决方案。BuzzFeed是美国的一个新闻聚合网站,2006年由乔纳·佩雷蒂(Jonah Peretti)创建于美国纽约。BuzzFeed致力于从数百个新闻博客那里获取订阅源,通过搜索、发送信息链接,为用户浏览当天网上的热门事件提供方便,被称为媒体行业的“颠覆者”。基于对内容热度的了解,BuzzFeed的一项分析工具POUND(Process for Optimizingand Understanding Network Diffusion)能够展示在线内容是怎样从下游的网站访问开始一步步传播的,一段BuzzFeed的内容是如何从一个通道被分享到下一个的,无论是点对点的邮件还是社交媒体,都能够被这些技术所捕捉。

一般我们只能看到一段内容引发了推特、脸书的若干条分享转发,但是无法看到其传播的路径。而BuzzFeed的POUND工具则可以清晰表明,其真实的分享路径是一条推特引发了大概20次脸书的分享和7次Linkedin的转发。这代表着对于了解网络扩散的算法的优化,从最初的分享者开始,复杂的网状模式传递给其他渠道的环节和其中的关联都可以被掌握。该工具能够通过跟踪包含在文章URL中的匿名代码来跟踪这个跨平台共享。在了解了这些信息数据之后,BuzzFeed就可以更好地帮助自身内容进行二次传播,从而优化自身内容的传播价值。

新媒体的内容运营流程中的另一个重要环节是内容的交易,包括内容的购买与销售、内容的置换等。在全球媒体产业中,内容交易市场已经非常规模化和成熟化,国内的内容交易也由来已久,在大数据的作用下,新媒体的内容交易出现了更多的变化。

按照此前的论述,新媒体内容运营的另一个重要环节是通过内容销售实现版权收入。这就涉及了内容交易这个话题。交易双方在交易过程中必须对所交易产品进行充分的评估。然而,媒体内容产品不同于普通的标准化产品,它同时兼具物质产品与精神产品的属性,因而对媒体内容的评估是一个专业化程度很高的课题,在国内外已经有了上百年的学术探索和机构实践历史。

不同种类的内容产品、不同阶段的内容产品,在评估方法、交易估值方面都会存在显著的差异。一直以来,媒体内容的交易评估都在追求尽可能的准确与精细,为了不断优化交易决策,交易双方需要了解待交易的内容产品方方面面的数据与信息,并将这些数据信息进行有效的整合,从而为决策判断提供重要参考。总体来说,用以进行内容交易的内容评估是一套完整的数据体系,包括评估指标评估方法和评估流程。这三个变量的不同会直接影响最终的评估结果,从而改变交易行为。因此,一直以来,媒体的内容产品交易都与数据密不可分,只是在不同的发展阶段,由于人们能够掌握的数据量的大小、数据类型的多少、数据分析和处理能力的强弱不同,因而体现出了不同的特点。

内容交易的第一个环节是交易之前。

此时,卖方需要考虑三个核心问题,即销售怎样的产品、何时销售、以怎样的价格销售。销售怎样的产品,需要卖方充分结合市场需求,对内容素材进行适当的编辑和包装,比如此前提到的拆条、重组等,因为不同的买方需要的内容产品是不同的。何时销售即思考在怎样的时机将产品销售出去,从而获得最高的利润。以怎样的价格销售考虑的是定价问题。而买方考虑的问题与此相对应,也是用怎样的价格,在怎样的时间,购买怎样的产品,此后的环节就是交易中的交易管理和交易后的交易维系等。

在新媒体机构的内容产品交易中,大数据的作用体现在两个基础层面。第一,帮助交易双方获取更加大量的数据作为决策支撑。第二,帮助交易双方以大数据的理念和技术手段来处理相关数据,无论是历史积累数据还是实时抓取数据,对这些数据的正确处理都可以提升数据的使用价值,更好地促进销售。在这个过程中,利用大数据对交易产品进行充分的评估是一个非常必要的步骤。

大数据给新媒体机构内容产品交易带来的另一项改变体现在交易的方式与手段上。在媒体内容交易中,视频内容是非常典型的一个分支,其主要的交易方式是通过交易展会(如电视节和电影节等)、版权交易中心(各地政府均建有版权交易中心,并允许社会机构参与),以及线上交易平台来实现的。传统的交易模式已经无法适应新媒体时代的市场需求,所以开放化、精细化和在线化是今后的必然发展方向,大数据将在其中发挥极为重要的作用。

(1)业界的相关探索

2013年SMG旗下的上海五岸传播有限公司与成都索贝数码科技股份有限公司成立了合资子公司——上海五翼文化传播有限公司,负责SMG内容交易平台的开发和运营。2014年1月该平台正式上线,命名为秒鸽传媒交易网。秒鸽借鉴了“淘宝”的平台模式,客户(内容成品或素材版权的所有方)可以进入平台的“商场”中开设店铺,而商场则从交易订单中抽取佣金。同时,依托海量内容,平台也可为客户提供各类增值服务,包括信息订阅、版权管理等。

(2)学术界的相关研究

在这个方面,中国传媒大学广告学院所探索的“内容银行”模式是一个非常典型的案例。所谓内容银行是指“在网络融合背景下,一个基于海量内容建立起来的开放式的内容交易和管理的系统平台,通过建立统一的交易标准,搭建内容存储、支取、增值的机制与平台,以云存储为基础,为每日内容提供存储、展示、搜索、分析、评估、衍生、竞价、交易、管理、投融资等全功能服务,加速内容交易、流通、增值,实现内容安全与高效的管理”。从这个定义来看,大数据不但将被充分运用于新媒体内容产品销售的各个环节当中,并且还会为新媒体机构提供全新的销售方式与销售手段。

在具体的功能设置上,内容银行将在提供海量数据的基础上,实现量化与质化交叉融合的内容评估功能,让交易双方都获得更好的决策参考;同时提供线上与线下相结合的展示交易平台,为交易双方实现智能化在线交易管理与操作;借鉴互联网实践构建RTB技术平台,实现内容交易的实时竞价,促使交易行为公开、透明、即时地开展,并最大限度地保障交易双方的利益。虽然内容银行只是新媒体机构内容交易发展方向的一个典型代表与探索,但是大数据将深刻地改变新媒体机构的内容交易方式与手段是毋庸置疑的。