微博用户画像的功能结构图如图9-4所示。图9-4微博用户画像功能图数据爬取模块主要功能是定期使用爬虫得到最新的新浪微博用户数据并且更新数据库。对于诸如“性别”“是否加V”“是否允许所有人发给我私信”等可枚举的字段,使用柱状图和饼图进行统计结果的展示;对于诸如“粉丝数”“关注数”“微博数”“收藏数”等结果不可枚举的字段,使用散列图描述样本的分布。最后,给出多个指标的联合分析,帮助更好地分析用户分布。......
2023-06-28
影视用户画像系统的建立需要依赖于具体的应用场景以及所拥有的数据。在此采用了某公司推出的一款互联网WiFi产品中采集的用户行为日志以及其他相关的用户信息作为源数据。该日志中包含了用户浏览部分影视内容核心页面的历史记录:用户MAC地址、访问时间、接入设备MAC地址、访问页面类型、页面URL、客户端类型等。由于用户行为日志中提取出的电影和电视数据不足以支撑后续的分析与处理任务,需要通过添加辅助数据采集模块,采集相关的电影和电视节目表单数据作为用户行为日志的补充。依据用户行为日志中现有的数据信息补充日志中残缺的部分,所构成的完整数据集合提交给大数据处理分析平台进行处理分析。然后,通过可视化模块进行展示达到用户画像助力企业为用户进行推荐。
影视用户画像系统的整体架构分为四层:数据源层、数据采集层、基于Hadoop的大数据分析平台层、数据可视化层。基本流程为:数据采集层采集系统所需数据并将数据存入数据源层;大数据平台层由数据源层导入数据并且对数据进行分析与处理,将处理完成的结果导出到数据源层;数据可视化层从数据源层读取数据并将数据呈现在Web端页面供管理者参考。用户画像系统架构如图9-6所示。
图9-6 用户画像系统架构图
用户画像系统分为三大模块:数据采集模块、基于Hadoop集群的大数据分析平台、数据可视化模块。宏观上讲,数据采集模块主要用于补充用户行为日志中缺乏的电影数据、电视节目的相关数据以及源数据对接,使得数据集更加完备,为之后的分析与处理获得全面且合理的数据集做准备。基于Hadoop集群的大数据分析平台对用户行为日志经过清洗、规范化、分析与处理等步骤为用户标识相应权重的标签,实现为用户“画像”的目的。数据可视化模块将大数据平台中分析完成的结果进行展示,直观地看到用户的人画像,为决策起到辅助作用。
影视数据采集主要采集三个方面的数据:电影数据、电视数据以及源数据。电影数据来源于豆瓣网,电视数据和源数据主要是从第三方API接口定时通过爬虫爬取。数据可视化模块中,主要采用SSM框架,商业级ECharts图表框架进行展示。
有关工业智能技术与应用的文章
微博用户画像的功能结构图如图9-4所示。图9-4微博用户画像功能图数据爬取模块主要功能是定期使用爬虫得到最新的新浪微博用户数据并且更新数据库。对于诸如“性别”“是否加V”“是否允许所有人发给我私信”等可枚举的字段,使用柱状图和饼图进行统计结果的展示;对于诸如“粉丝数”“关注数”“微博数”“收藏数”等结果不可枚举的字段,使用散列图描述样本的分布。最后,给出多个指标的联合分析,帮助更好地分析用户分布。......
2023-06-28
目前互联网用户数据冗杂,不能很好地从中提取有效信息而用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。应用用户画像可以对大量的用户数据进行有效分析,从而更好地定位产品,精准投放产品并进行一系列的个性化服务。用户画像是真实用户的虚拟代表,是建立在一系列真实数据之上的目标用户模型,是一种描述目标用户、了解用户特点与需求方向的有效工具。......
2023-06-28
在用户画像的研究中,一般认为其主要构成有用户属性、用户行为、用户流失三个主要层次。由于不同的应用场景,用户所呈现出的状态有所不同,所以用户画像的定义各有千秋。从统计学的角度出发,查阅相关资料,本书认为,用户画像的定义可以这样被定义:用户画像是对现实世界中用户的数学建模。用户画像的定义告诉我们,用户画像是由标签集合构成的。......
2023-06-28
传统用户画像数据仅来自业务系统、事件系统、关系信息等,多类信息缺失或不全,很难形成准确、全方位的画像。将标签体系的建立与基于用户数据的分类特征相结合,将用户标签刻画得更加准确与贴近用户群体信息。通过研究与实践,使用统计方法与统计指标,将用户画像的建立做到更为准确,从而为后续的用户推荐与精准营销打好坚实的基础。......
2023-06-28
两个人见状,大吃一惊,忙问何故,只听华佗解释道:“你俩虽病症相同,但是病因却不同,一个是内部伤食引起的;另一个是外感风寒,着了凉引起的,所以需要不同的药物治疗。”短视频博主明确了用户的画像,也就相当于精准地掌握了目标用户的性别特征、年龄大小、地域分布特征、受教育程度、身份特征、心理需求等。当然,经过一番用户的画像分析,我们在短视频输出时会更加有目的性,更加容易击中用户的内心。......
2023-11-26
用户是电网企业的服务对象和生存基础,利用大数据来分析用户的行为与用电习惯,可以预测未来业务的发展趋势,提高供电服务质量,同时提高用户满意度。电网用户画像系统的建设涉及的数据量大,指标体系复杂,从用户画像的核心标签体系来看标签维度、标签分类、标签指标、标签值。仅从电网客户个体画像来看就有数十个关键数据主题需要进行分析,在此仅以两例关键代表性数据主题的分析进行说明。②用电客户欠费风险分析。......
2023-06-28
当计算机系统在遭受如火灾、水灾、地震、战争等不可抗拒的灾难和意外时,容灾系统将保证用户数据的安全性。实际中可根据RPO和RTO的要求规划建设容灾备份系统。容灾系统包括数据容灾和应用容灾两部分。数据容灾可保证用户数据的完整性、可靠性和一致性,但不能保证服务不被中断。......
2023-10-18
核心功能的查询占到了用户信息发送数量的近一半。表4-4“河北大学青年”互动活动相关数据统计表以上截取了单日发送人数较多的三个样本日,这三日开展的活动线上用户与线下用户行为均具有高度契合度。为此掌握重要的时间节点,及时准确地进行消息推送,及时发声显得尤为必要。因此,线上线下的互动能够进一步激发用户的使用,促进接受行为的发生。......
2023-11-09
相关推荐