利用大数据挖掘技术来优化算法,可进一步提高各种个性化服务质量,提升高校师生及相关工作人员的满意度。一方面,可以利用Mahout提供的主成分分析、奇异值分解等降维方法进行数据降维,以帮助解决高校图书馆大数据的高维度问题;另一方面,可以利用Mahout中已实现的相关算法来实现个性化服务。......
2023-07-24
1.用户行为模型构建与个性化服务策略
个性化服务一般具有实时性、交互性、个性化、主动性和人性化5个特征。结合图书馆大数据服务的背景,这些特征具有新的内涵,如图5.3所示。
图5.3 用户行为模型构建与个性化服务策略
图5.3中,实时性和交互性是海量数据情景下用户高效获取知识以应对“知识迷航”的必然要求;个性化是缓解用户“信息过载”的重要手段,也是图书馆服务的主要目标和本质特征;主动性和人性化是图书馆服务水平提升和帮助用户克服“情感缺失”,获取良性情感体验的重要标志,具有鲜明的时代特点。
(1)利用本体和云平台上的关联数据技术应对“知识迷航”。本体是对特定领域中的概念及其关系的形式化表达,具有领域性、规范化、形式化和可共享的特点,是由规范化的术语(或词汇)标识的一套概念框架。[38]关联数据[39](Linked Open Data,LOD)能将基于本体的各类异构知识库有机链接起来,形成大规模关联数据库。一方面用户能够依据规范化的领域本体术语查询,精确匹配关联数据库记录,有利于提高查全率和查准率,实现高效检索和互动知识问答;另一方面,由于云平台的高计算性能可以极大缩短平台访问和查询时间,用户得以从海量数据库中快速精准获取所需要的信息,避免“知识迷航”。
(2)构建用户个性化模型、实现个性化推荐,缓解“信息过载”。个性化服务需要仔细分析用户行为特征,并基于本体进行结构化描述,建立起反映用户特点的行为模型。个性化推荐则是在建模的基础上通过数据分析手段,从海量低价值密度的信息中挖掘出高价值的知识推荐给用户,以有效缓解大数据时代“信息过载”的困窘。
(3)分析用户兴趣与挖掘用户需求,克服“情感缺失”。用户兴趣是情感的一种显性表达,从技术角度看,可通过用户个体日志的分析统计来获取;用户需求则是用户深层次的隐性情感需要,一般需应用相关数据挖掘算法才能发现。利用建立在用户行为日志数据分析之上的用户显性兴趣统计和隐性需求挖掘方法,能为不同兴趣和不同需求的用户主动提供个性化服务,同时体现“人性化”关怀,竭力满足用户的情感需求,有利于提升大数据环境下图书馆的服务质量和水平。
根据以上分析,本研究拟基于本体和关联数据技术,构建用户行为模型,通过分析显性用户兴趣和隐性用户需求,提供大数据情景下的图书馆个性化服务。
2.用户行为模型构建方法
(1)用户行为本体模型的设计。模型如图5.4所示,描述用户行为的“用户图书服务信息”类包括“图书浏览,检索,收藏,评论,借阅”5个子类;“用户知识服务信息”类包括“知识浏览,检索,收藏,评论,下载”5个子类。由于“用户行为信息”日志数据库的记录由用户的基本属性和图书信息(或知识信息)的属性组成,因此“用户图书(知识)服务信息”类需要和“用户基本信息”类以及“图书(知识)信息”类通过关联数据技术产生关联。为方便理解,一个依据本模型的实例见表5.3。
图5.4 基于本体和关联数据的用户行为模型
表5.3 本体模型框架下的“用户行为信息”实例
(2)用户行为模型中相关类的属性设计。“用户基本信息”类包含的属性分别为“用户id”“用户姓名”“单位”和“教育水平”,属性数据用来描述用户基本特征,在用户使用图书馆服务系统平台时,通过注册个人资料时获取;“图书信息”类对应的属性为“书目名称”“作者”“出版社”和“ISBN书号”,“知识信息”类对应的属性为“知识id”“知识标题”和“知识创建者”,其属性数据来自于各自领域的本体数据库。经过细致调研,参照大英图书馆为BNB所设计的关联数据本体模型,并选择万维网联盟W3C组织推荐的知名本体库(如<http://purl.org/dc/terms/>,见图5.4中的图例部分)确定关联关系和对应的属性类别,以方便数据交互和知识共享。
3.基于用户行为模型的个性化服务方案
个性化服务方案由用户行为本体数据库构建、用户兴趣和需求本体挖掘及基于本体的个性化服务3部分组成,如图5.5所示。
图5.5 基于用户行为模型的个性化服务方案
(1)用户行为本体数据库构建过程。按照如图5.5所示的用户行为本体模型架构,生成对应的数据库字段,密切结合图书馆书目(或知识领域)本体概念库,从原始的用户服务日志和用户基本信息的数据库中解析出对应字段的数据,组合构建成为用户行为本体数据库。该数据库需要依据日志变化以更新本体模型中的术语,即通过对用户原始的日志信息分析和挖掘,提取概念或主题,并按照本体技术进行规范后,加入到本体库中。
(2)用户显性兴趣和隐性需求本体提取过程。依据对每个用户行为日志库的分析统计,提取用户显性兴趣本体术语以准确反映用户的偏好;另外,通过对该库的全体用户日志的数据挖掘,提取隐性需求本体,注意这种基于数据挖掘算法“发现”的本体术语,是系统对用户行为日志库中所有用户的历史行为“学习”和“挖掘”后,找出的与用户显性兴趣本体术语“密切相关”的术语,能够满足用户扩展和隐性的需求。
(3)个性化推荐过程。当用户登录服务平台时,根据用户的兴趣本体,查询相关数据库(如书目、论文、专利和知识库等),将结果推送给用户,实现用户显性兴趣的个性化推荐;如果用户进一步在服务系统上检索图书(或知识),则将用户输入的检索语句进行语境分析,抽出特征词,匹配隐性需求的本体术语,将查询结果推送给用户,实现用户隐性需求的个性化推荐。
有关高校图书馆大数据应用模式与实证研究的文章
利用大数据挖掘技术来优化算法,可进一步提高各种个性化服务质量,提升高校师生及相关工作人员的满意度。一方面,可以利用Mahout提供的主成分分析、奇异值分解等降维方法进行数据降维,以帮助解决高校图书馆大数据的高维度问题;另一方面,可以利用Mahout中已实现的相关算法来实现个性化服务。......
2023-07-24
考虑到用户日志数据库体量庞大,且增长迅速,在应用上需要采用大数据分析框架。其中以“图书情报”作为本体术语的查询结果直接来自于用户问题,是正常检索,而以“知识管理”作为本体术语的查询来自于数据挖掘的结果,是隐性需求的个性化推荐。......
2023-07-24
表8-4有无分享过抖音视频用户在使用时长上的差异通过调查,71.54%的抖音用户将自身定位为“观看者”,24.62%的抖音用户参与到了抖音的创作中。计量资料采用均数±标准差的方式,计数资料以频数表示。表8-5不同性别抖音用户在身份选择上的差异在使用抖音的过程中,约70%的用户有过观看抖音作品的分享行为。评论已经成为短视频用户重要的使用行为,在一些视频中甚至成为补充视频内容的重要元素。......
2023-11-09
应用数据挖掘技术有助于解决高校图书馆大数据应用中的知识迷航和信息过载问题。李艳等[13]从宏观上研究了高校图书馆大数据挖掘与决策分析体系,设计了基于高校图书馆特点的体系架构模型与业务分析流程,并探讨该体系架构在个性化服务中的应用。Yi C等[14]提出将数据挖掘算法应用到高校图书馆大数据个性化推送服务,着重讨论了关联规则算法和聚类算法的应用。......
2023-07-24
大数据环境下个性化服务的研究引起学界重视。大数据技术的迅速发展以及图书馆个性化服务要求的不断提高,催生了大数据环境下个性化服务的研究,尤其是在关联数据技术与个性化服务结合方面取得了积极进展。以下结合大数据环境下个性化服务特征,讨论用户行为模型的构建策略。......
2023-07-24
在大数据时代,个性化推荐、检索和推送是高校图书馆的三种重要的个性化服务方式,它们之间有联系,也有区别。大数据环境下高校数字图书馆的高级检索应用也需要个性化,进一步提高检索结果的精准性和检索结果排序的合理性。推送系统能充分体现高校数字图书馆以用户为中心的管理理念,促进师生更积极地借阅图书,激发创新热情。......
2023-07-24
高校内,无论是教师还是学生,进入图书馆享受其传统服务的人数越来越少,“入馆率”和“借阅率”越来越低,传统的图书馆服务模式已经不适应用户的需要,泛在信息环境下的用户对图书馆的服务有了新的需求。面对新的服务需求,传统服务的不足体现在以下几点:传统服务是被动服务,表现为被动地等待读者接受服务的现象。资源服务方式呈现无中心化,个人信息行为的实际化、现实化,个人资源服务的多种化、复杂化等显著的网络服务特色。......
2023-08-05
关联规则是数据挖掘领域中的重要算法,经典的关联规则算法广泛应用于零售领域的购物篮分析。在高校图书馆个性化服务中,关联规则可以用来发现用户使用文献之间的关系,发现同时被频繁使用的文献,从而帮助系统在用户浏览、下载、借阅时向其推荐相关文献。......
2023-07-24
相关推荐