影视用户画像系统的建立需要依赖于具体的应用场景以及所拥有的数据。用户画像系统架构如图9-6所示。基于Hadoop集群的大数据分析平台对用户行为日志经过清洗、规范化、分析与处理等步骤为用户标识相应权重的标签,实现为用户“画像”的目的。数据可视化模块将大数据平台中分析完成的结果进行展示,直观地看到用户的人画像,为决策起到辅助作用。......
2023-06-28
微博用户画像系统基于新浪微博的开放接口,使用真实的微博用户数据。数据的爬取、更新和维护是系统的关键。在使用系统的时候,需求主要分为两方面:一是基于单个用户的详细画像,单个画像可用于为单个案例的分析提供细粒度的证据支持;二是批量数据的统计分析,批量画像主要用于一批用户的分析,挖掘用户之间的共同特征。接入系统的多少,是衡量一个系统成败的关键。因此,还需要提供一个友好的查询接口,在本系统中,查询接口模块提供接入查询功能。
微博用户画像的功能结构图如图9-4所示。
图9-4 微博用户画像功能图
(1)数据爬取模块
主要功能是定期使用爬虫得到最新的新浪微博用户数据并且更新数据库。爬虫模块分四部分:鉴权模块,鉴权通过之后接口才会开放;频率限制模块,太快的调用开放接口会导致接口无法使用;接口调用模块,调用接口得到用户数据;数据清洗模块,清洗数据请求模块得到的数据,然后存储在临时数据库中。
(2)单个画像模块
单个画像模块主要描述单个用户的画像信息,通常分三部分:单个用户画像,通过安全策略分析给出安全标签,通过K-means聚类算法给出用户类型标签,根据粉丝数、关注数、微博数、收藏数等指标在总体中的分布,给出统计标签;用户行为分析,包括每日登录时长分析、关注数分析、粉丝数分析、微博数分析、收藏数分析等,通过观察对应指标的趋势,可以对用户行为进行分析和预测;关系链分析,主要分析用户好友的年龄分布、关注数分布以及城市分布等。
(3)批量画像模块
批量画像是在单个画像的基础上进行统计分析,然后展示。对于诸如“性别”“是否加V”“是否允许所有人发给我私信”等可枚举的字段,使用柱状图和饼图进行统计结果的展示;对于诸如“粉丝数”“关注数”“微博数”“收藏数”等结果不可枚举的字段,使用散列图描述样本的分布。最后,给出多个指标的联合分析,帮助更好地分析用户分布。
(4)查询接口模块
查询接口模块提供根据协议进行查询的功能,能同时处理大量的并发请求,同时又有很好的扩展性,可以自动化地更新网络拓扑结构,添加新的机器到当前的集群中负载均衡。查询接口模块分三层:接口层,负责对流量进行清洗,当请求包不符合约定协议时则不响应,当流量过大时进行过载保护,只处理能力所及之内的流量包;逻辑处理层,接收来自接口层的请求包,根据用户请求的类型进行结果数据的重组,然后发给请求的用户;数据层,接收来自逻辑层的请求包,返回数据给逻辑层,数据层主要的要求是能快速地检索数据。
有关工业智能技术与应用的文章
影视用户画像系统的建立需要依赖于具体的应用场景以及所拥有的数据。用户画像系统架构如图9-6所示。基于Hadoop集群的大数据分析平台对用户行为日志经过清洗、规范化、分析与处理等步骤为用户标识相应权重的标签,实现为用户“画像”的目的。数据可视化模块将大数据平台中分析完成的结果进行展示,直观地看到用户的人画像,为决策起到辅助作用。......
2023-06-28
杜蕾斯的微博运营,以幽默搞笑的“老司机”形象为主,生产出大量的轻松诙谐的高质量作品,受到了用户的喜爱。截至2017年7月,杜蕾斯目前关注122,粉丝219万,全部微博一共19 000多条。杜蕾斯的微博运营,在行业的地位是不言而喻的,无数的微博运营主体都想学习杜蕾斯的先进经验,但往往最后成为“四不像”。......
2023-11-17
在用户画像的研究中,一般认为其主要构成有用户属性、用户行为、用户流失三个主要层次。由于不同的应用场景,用户所呈现出的状态有所不同,所以用户画像的定义各有千秋。从统计学的角度出发,查阅相关资料,本书认为,用户画像的定义可以这样被定义:用户画像是对现实世界中用户的数学建模。用户画像的定义告诉我们,用户画像是由标签集合构成的。......
2023-06-28
虽然微信和微博的运营有着较大的区别,涉及的运营方法也不一样,但是微信和微博之间不是二者选其一的关系,更多的时候应该采用组合的方式,相互补充才能达成更好的营销或者传播目标。应根据内容的性质和传播的属性来合理使用或者组合使用微信和微博。微信和微博的运营组合,是社交关系与兴趣关系的组合。微信和微博在现有阶段都具备极强的发展空间,两者的组合方法还具备更多的发展可能性。......
2023-11-17
微博是指一种基于用户关系信息分享、传播以及获取的通过关注机制分享简短实时信息的广播式的社交媒体、网络平台。图2.4HTTP连接原理Cookies是指某些网站为了辨别用户身份、进行会话跟踪而存储在用户本地终端上的数据。表2.1微博抓取规则示例每页微博数据请求到页面并完成解析后,按照抓取的逻辑与规则插入到数据库中,若Cookies数量较少时,可拟定爬虫访问频率,降低数据服务区访问压力。......
2023-06-15
随着微博对用户日常生活的渗透,基于微博平台的舆论正对社会产生越来越大的影响。后续调查显示,女司机被打是因变道而引发的别车。尽管这一时期的网络情绪呈现为多元化,但微博舆论的情绪流整体上呈现为对男司机暴力行为的谴责和对女司机的同情。这一点从该条微博5月3日当天的评论情绪分布中得到印证。截至5月3日22:00,与事件相关的微博仅有111条,为当天的最高点。......
2023-11-17
2013年是京东进入电子商务发展的第十个年头,京东展开了一场以新浪微博为主要传播阵地的公关活动,为京东6月促销季进行网络造势,打造了一场京东的社交媒体生日盛宴。他们依托新浪微博平台,展开两大阵营的内容输出。一方面以京东官方微博为主,实时传递促销优惠信息,策划网友互动活动,实时咨询报告促销战况,与合作伙伴品牌官微一起微博庆生。......
2023-07-16
比如,针对“逻辑思维”的创始人而言,其在对自己所建立微信公众号进行运营期间,都会始终坚持每天为粉丝推送语音,没有间断过。此外,除了注重上述营利因素外,为了进一步提升微信公众号运营质量,还要注意做好运营维护管理,借助生态运营去增强公众号粉丝的黏性。......
2023-11-22
相关推荐