首页 理论教育多重算法推荐解决用户没有内容可看的困境

多重算法推荐解决用户没有内容可看的困境

【摘要】:在这种“去中心化”的精准推送中,内容和社交关系成为被抓取且作为信息精准分发的主要依据。正是基于这种算法推荐使得用户在抖音使用过程中通常会看到通信录好友发布的内容,平台通过算法也优先推荐强关系的好友发布的内容。通常来讲,在内容流量池表现较好的视频内容往往会进入叠加推荐的行列,从而获得更多的阅读和点赞。

近一阶段以来,算法成为新闻传播学研究领域的“网红”,计算科学、情报科学、社会网络科学等自然科学研究方法和研究工具逐渐被引入到新闻传播学领域,借助先进的可将数据公式化和结构化的研究工具,原本在理论描述中的传播规律和效果评价真正得以量化并以图示化的方式进行表达,一些原本模糊的关系和不曾发现的现象联系逐渐被揭示和认可,从而为新闻传播学领域的研究开拓了新的研究空间。

算法是解题方案的准确而完整的描述,是一套相对完整的具有较强逻辑性的命令,算法代表着用系统的方法来解决问题的策略机制,也就是说,可以在特定规格输入的有限时间内获得所需要的输出。不同的算法可能由不同的时间、空间或效率来完成同样的任务。算法本身并没有优劣之分,更多地是以用在解决问题时需要的空间复杂度与时间复杂度来衡量。[5]算法大致分为基本算法、数据结构的算法、数论与代数算法、计算几何的算法、图论的算法等。随着计算机的发展,算法已得到广泛开发并投入应用。优秀的算法不但节约了用户寻找优质内容的时间成本,同时也使得平台运营商对用户基本情况有了大致的了解。诸如一些外卖平台在用户使用时就会就近推荐外卖商家或按照用户的使用习惯推荐最感兴趣的菜品,这都是算法在移动社交领域的应用。

抖音在短时间内迅速扩大市场、积累用户,其背后的智能算法团队可以说功不可没。抖音的算法大致有以下三种方式:

1.基于用户基本信息的协同过滤

基于用户基本信息的协同过滤是抖音整个算法体系中最基础和最简单的基础算法。抖音通过用户注册时的基本信息,如:性别、年龄、地址和基本兴趣点对用户的画像有了大致的描绘,然后在信息分发过程中,通过考虑用户之间的相似程度进行相似内容的推荐。我们可以构建这样一个推荐模式模型(图7-6)。

假如A、B、C、D的基本信息较为相似,那么前期在A、B、C共同感兴趣的内容或产生点赞、评论、转发等使用行为的内容会较为优先推荐给D。通常针对平台用户的初期使用阶段以这种获取数据的方式为主。比如在抖音的主界面,分为同城和推荐两个模块,推荐模块一个重要的原则就是视频内容和用户兴趣的匹配程度,匹配程度越高的信息越能够被推荐。

2.“去中心化”的精准推送

图7-6 基本信息协同过滤模式图

社交媒体最重要的原则就是“去中心化”,每个用户都是传播场域中的节点,每个节点都可以独立生产内容,拥有一定量的话语权,而不是内容集中于少数的关键用户。在这种“去中心化”的精准推送中,内容和社交关系成为被抓取且作为信息精准分发的主要依据。(www.chuimin.cn)

这一类的精准算法可以分为两大类:一类是以内容兴趣点为筛选维度的推荐,这个维度在现实的社交环境中联系较弱,甚至没有联系;另一类是以社交强联系为筛选维度的推荐,在通讯录中的好友、同学都会成为推荐所抓取的对象,重合部分往往会获得较高的评价。

内容维度可以理解为以相同的职业、爱好、话题组成的相近兴趣的集合,如图7-7,纵向的椭圆为基于内容兴趣点的图示,每个方形图案代表所感兴趣的视频。平台基于用户使用行为的习惯,诸如点赞、评论、转发等行为,通过数据驱动的方式挖掘用户的兴趣点,从而进一步取悦用户,增加黏度。

但是正是这种以兴趣为标准的推荐模式牺牲了用户多元化获得信息的“权利”,限制或影响了用户改变兴趣的想法,这种精准内容推荐的模式使得用户的接受内容过于一致化或单一化,会形成审美疲劳。同时也限制了用户获得视频的类型,只能局限于相对熟悉的领域,陷入固化的信息空间中,形成一个信息的孤岛,“信息蚕房”效应不断叠加。“信息茧房”概念是由哈佛大学法学院教授、时任美国总统的法律顾问凯斯·桑斯坦在其2006年出版的著作《信息乌托邦——众人如何生产知识》中提出的,指的是信息个性化技术使得人们产生减少阅读多样化内容的趋势,由于个性化推荐系统是根据用户已有的阅读偏好进行关键词匹配和推荐,一些相似性较低的内容基本上不会被推荐,用户的阅读内容会变得狭隘。通过对互联网的考察,桑斯坦指出,在信息传播中,因公众自身的信息需求并非全方位的,公众只注意自己选择的东西和使自己愉悦的领域,久而久之,会将自身桎梏于像蚕茧一般的“茧房”中。

图7-7 “去中心化”精准推荐模式图

社交关系维度可以理解为以现实的社交关系为连接的集合,如图7-7横向的椭圆为基于社交关系的图示,每个灰色(比较小且比较密集)的原点代表社交圈中用户生产和收看的视频。每个人的社交圈都随着移动互联网技术的进步而不断扩大,但是用户本身和现实社交中好友的关注点相似性不高,所以这个横向椭圆内关注点的数量纵向多,但是颜色和大小(颜色和大小代表用户对信息本身的感兴趣程度和喜好程度)并不那么强烈和突出。正是基于这种算法推荐使得用户在抖音使用过程中通常会看到通信录好友发布的内容,平台通过算法也优先推荐强关系的好友发布的内容。

3.流量池的叠加推荐

与算法的出现类似,流量池也是近段时间以来频繁出现的热门词。这里需要指出,之前在新媒体研究领域里流量思维是较为集中的研究热点,甚至有学者指出得流量者得天下。流量池思维和流量思维是两个概念,流量思维是指获取流量后变现流量,流量池思维则是要获取流量并通过存储、运营和发掘等手段,再获得更多的流量。流量思维和流量池思维最大的区别就是流量获取之后的后续行为,后者更强调如何用一批老用户找到更多新的用户。通常来讲,在内容流量池表现较好的视频内容往往会进入叠加推荐的行列,从而获得更多的阅读和点赞。叠加推荐是以内容的综合权重作为评估标准,综合权重的关键指标有:完播率、点赞量、评论量、转发量,且每个梯级的权重各有差异,当达到了一定量级,平台以大数据算法和人工运营相结合的机制不断对其进行推荐。[6]比如当你发布一条视频时,平台会自动分配到一个流量池中,分发到一定数量的用户的推荐界面,然后通过统计这个视频的播放效果,形成一个加权分数,转发量、评论量、点赞量的权重依次递减,分数越高则获得叠加推荐的机会越大,播放效果好的视频会再次加入流量池进行更大范围的分发,而表现较差的视频则失去了被推荐的机会,沉淀至流量池底部。第二次推荐如又获得比较好的反馈则进入下一轮的推荐,从而获得更大的推荐(图7-8)。