利用大数据挖掘技术来优化算法,可进一步提高各种个性化服务质量,提升高校师生及相关工作人员的满意度。一方面,可以利用Mahout提供的主成分分析、奇异值分解等降维方法进行数据降维,以帮助解决高校图书馆大数据的高维度问题;另一方面,可以利用Mahout中已实现的相关算法来实现个性化服务。......
2023-07-24
在大数据时代,个性化推荐、检索和推送是高校图书馆的三种重要的个性化服务方式,它们之间有联系,也有区别。
1.个性化推荐
对于高校图书馆而言,推荐是一种为用户提供建议,帮助他们挑选图书、论文和专利等文献资料并做出最终决策的技术。就传统的图书推荐方法而言,推荐热门书籍的难度并不高,但是用户转化率(用户接受或认可该推荐)却不很理想,因此需要针对用户兴趣和爱好的个性化推荐。
关于个性化推荐的研究较多,其中推荐的精准度是衡量推荐系统的一个重要指标,受到广泛重视。研究成果表明,仅考虑精准度还不够,成功的推荐还应该具有推荐的新颖性和惊喜性。例如,一位学生已经准备借阅《数据结构》这本书,无论是否给他推荐,他都会借阅。推荐《数据结构》的结果只是方便该生借阅一本他本来就准备借阅的书。学生会觉得这个推荐结果很不新颖,难以令他惊喜。因此,成功的高校图书馆个性化推荐服务应该不仅能够准确预测用户的行为,而且能够扩展用户的视野,帮助用户发现那些他们可能会感兴趣但却不那么容易发现的知识或文献。
2.个性化检索
文献检索是高校图书馆提供的最主要服务之一。检索有精确检索和模糊检索两类。以图书检索为例,在精确检索中,用户明确知道自己需要的图书信息;但在模糊检索中并非如此,用户并不确切知道书籍的名称等信息,可能只是想找出一些与模糊搜索相近或相似的并对自己有用的文献资料。检索与推荐一样,都是用户查找信息的重要方式,这点决定了检索和推荐所需处理的数据以及返回给用户的信息往往都是同质的,但是它们也有明显的区别:如果说推荐在某种程度上需要满足的是用户对“新颖”的渴望,检索则是精准的定位和查找。例如,检索时输入检索词“计算机”,检索系统需要判断用户需要的是计算机专业类的书籍,还是计算机应用、操作类的非计算机专业书籍。除了精准性要求外,检索还需要考虑优化检索结果并对其排序。例如,“数据结构”是计算机专业的核心课程,教材众多,检索时输入“数据结构”,返回检索结果可以针对不同用户有不同的排序。对于教师用户,可以将高级教材、英文教材排在前面供教师参考;对于刚开始学习该课程的学生用户,则把入门教材排在前面。大数据环境下高校数字图书馆的高级检索应用也需要个性化,进一步提高检索结果的精准性和检索结果排序的合理性。相对于推荐而言,由于检索对精准性的要求更高,检索更需要精确地获取用户的个性化特征。
3.个性化推送
推送系统主要是利用信息技术手段向用户推送他们可能感兴趣的信息,实现高校图书馆服务的自动化,为用户提供周到的服务。推送系统能充分体现高校数字图书馆以用户为中心的管理理念,促进师生更积极地借阅图书,激发创新热情。
实现文献推荐和检索功能需要建立基础的用户画像,利用用户的偏好进行个性化推荐和个性化检索。从广义上说,这也属于个性化推送的范畴,因此,图书馆个性化推荐中的相关技术,例如协同过滤也完全可以用于推送系统。基于检索和推荐技术的推送可以结合起来使用,相辅相成,为图书馆信息推送提供更高效的实现途径。另外,推送系统具有更多的渠道,例如通过手机应用给教师推送感兴趣的学术专著,或者发邮件定期唤醒不够活跃的学生等,推送系统需要更多地考虑用户的背景信息和历史行为。
有关高校图书馆大数据应用模式与实证研究的文章
利用大数据挖掘技术来优化算法,可进一步提高各种个性化服务质量,提升高校师生及相关工作人员的满意度。一方面,可以利用Mahout提供的主成分分析、奇异值分解等降维方法进行数据降维,以帮助解决高校图书馆大数据的高维度问题;另一方面,可以利用Mahout中已实现的相关算法来实现个性化服务。......
2023-07-24
应用数据挖掘技术有助于解决高校图书馆大数据应用中的知识迷航和信息过载问题。李艳等[13]从宏观上研究了高校图书馆大数据挖掘与决策分析体系,设计了基于高校图书馆特点的体系架构模型与业务分析流程,并探讨该体系架构在个性化服务中的应用。Yi C等[14]提出将数据挖掘算法应用到高校图书馆大数据个性化推送服务,着重讨论了关联规则算法和聚类算法的应用。......
2023-07-24
为验证本方案的可行性以及观察文献推荐效果,开展以下实证研究。本方案着重讨论面向内容的推荐,而图书或论文的内容在很大程度上由关键元数据决定。表10.2图书数据表10.3论文数据表10.4是结合表10.2中的图书与表10.3中的论文,依据混合关联的设计方案进行关联后并依据表10.1的评分标准所得到的结果,共形成15对关联二元组。按照这种方式,海量的图书和论文二元组将构建成大规模推荐网络图。......
2023-07-24
关联规则是数据挖掘领域中的重要算法,经典的关联规则算法广泛应用于零售领域的购物篮分析。在高校图书馆个性化服务中,关联规则可以用来发现用户使用文献之间的关系,发现同时被频繁使用的文献,从而帮助系统在用户浏览、下载、借阅时向其推荐相关文献。......
2023-07-24
图书馆大数据应用必须密切结合图书馆大数据服务的需求,针对性地提出应用模式和解决方案,以促进图书馆大数据服务的真正落地。本书利用语义网这一工具和技术,融合语义网最新研究成果,提出一种基于语义网的学科知识服务模式。因此本书提出面向科研的高校图书馆电子资源使用统计模式。......
2023-07-24
学术界和工业界对知识管理理论进行了深入而广泛的研究,然而迄今为止对知识管理涉及的具体内容及一般过程尚未形成统一认识。这里重点介绍图书情报领域专家的相关表述。其管理过程大致包括知识生产、组织、构建、检索、发现、分享、应用和创新等阶段。在知识经济的背景下,知识的发现、利用和创新是贯穿于高校图书馆各项业务工作的主线,知识管理理论也成为大数据时代图书馆大数据应用和服务的主要支撑理论。......
2023-07-24
图4.3论文数据库和图书数据库本体模型和聚合元数据关联。设有两篇论文的题名分别为:论文A:大数据时代数字图书馆面临的机遇和挑战论文B:大数据时代下图书馆的挑战及其应对策略按以下步骤计算它们的相似程度。......
2023-07-24
大数据环境下个性化服务的研究引起学界重视。大数据技术的迅速发展以及图书馆个性化服务要求的不断提高,催生了大数据环境下个性化服务的研究,尤其是在关联数据技术与个性化服务结合方面取得了积极进展。以下结合大数据环境下个性化服务特征,讨论用户行为模型的构建策略。......
2023-07-24
相关推荐