国内外专家学者对图书馆电子资源使用统计进行了多角度的研究和应用尝试。国内学者的研究主要集中在应用领域。钟克吟[13]利用ASP技术开发图书馆电子资源读者访问流量统计分析系统来提高数字资源服务效益;王政军[14]提出基于旁路监听技术的图书馆数字资源绩效分析的设计思路和方案,通过记录用户对电子资源的访问下载情况而实施资源访问监控;周欣等[15]提出基于用户日志进行数据采集和数据挖掘的方法,构建用户行为分析系统模型。......
2023-07-24
国内外学界在个性化推荐领域的研究非常踊跃,相关文献及综述较为丰富。[6][7][8]具体到图书情报领域,图书馆文献推荐的研究主要集中在图书馆信息系统中推荐方法的应用。
1.推荐方法类型
文献推荐方法一般涉及两个要素:文献资源和用户数据。一般需要在分析用户偏好的基础上推荐文献资源。主流的推荐方法包括基于内容、协同过滤和混合推荐三种类型。其中基于内容的推荐先分析用户感兴趣的文献和数据库中其他文献在内容上的相似度,再选择高相似度的文献实现推荐[9][10][11];协同过滤推荐则需要分析用户历史偏好或兴趣,实现偏好高相似的用户或内容高相似的文献之间相互推荐;混合推荐将目标用户个体偏好和各类资源的相似度分析融合起来实施推荐。
2.推荐方法应用
(1)国内外学界密切结合用户或文献的各种特征,将数据分析和挖掘算法引入推荐以提升推荐性能。如Tsuji K等[12]采用支持向量机方法对用户借阅日志和图书主题挖掘和分类,开发推荐系统并评估推荐效果;张闪闪等[13]依据中图法分类体系对图书归类,设计自动化评分规则来实现推荐;宋楚平[14]提出一种协同过滤改进方法,基于图书分类生成用户评价矩阵,将用户特征和图书特征纳入用户相似度计算,以提高推荐准确率和用户满意率;凌霄娥等[15]利用改进的K-medoids方法对用户和图书构建决策树分类模型,辅助分析用户的图书借阅偏好以实现推荐;李宇航等[16]借鉴迁移学习概念,构建跨域协同过滤模型,实现对用户多个领域的兴趣挖掘和个性化推荐。
(2)学界关注如何在保证推荐准确率基础上,兼顾推荐多样性的研究。如安维等[17]综述了提高推荐系统多样性的相关研究,认为不能“盲目崇拜”准确率,应该适当考虑多样性;Musto C等[18]从开放的关联数据“云”上(Linked of Data Cloud)免费获取知识库,结合图计算技术搭建图书推荐系统,并在DBbook图书数据集[19]上测试,实验评估结果表明,该系统能兼顾推荐的多样性和准确率。蓝冬梅[20]结合高校图书馆借阅记录,通过预测用户对各类图书的借阅偏好实施图书推荐,实验表明推荐的准确率和多样性同时得到提升。
(3)针对海量文献数据的挑战,学界也将云计算和Hadoop的分布式平台引入推荐系统,从改善计算设备软硬件性能的角度来提高文献分析效率。肖强等[21]改进传统的协同过滤算法,使之适应Hadoop平台上的分布式计算,并予以实验分析;赵彦辉等[22]分析用户借阅日志以获取借阅偏好值,搭建Hadoop分布式平台并运用MapReduce算法,测试系统性能与图书推荐效果的关系。奉国和等[23]针对单机系统上的推荐算法性能及推荐的准确率都很低下的问题,采用Hadoop分布式平台+Mahout引擎技术改进协同过滤算法,提高了推荐的准确率。
国内外学界在相关领域开展了积极研究,做了众多有价值的工作,主要集中在将不同的分析算法和分布式平台引入文献推荐,以提高准确率和多样性等指标。随着文献服务水平的不断提高和大数据技术的完善,图书馆文献推荐方法研究和实证分析也需要与时俱进。以下在分析大数据下图书馆文献推荐需求的基础上,提出两种不同的文献推荐方案。
有关高校图书馆大数据应用模式与实证研究的文章
国内外专家学者对图书馆电子资源使用统计进行了多角度的研究和应用尝试。国内学者的研究主要集中在应用领域。钟克吟[13]利用ASP技术开发图书馆电子资源读者访问流量统计分析系统来提高数字资源服务效益;王政军[14]提出基于旁路监听技术的图书馆数字资源绩效分析的设计思路和方案,通过记录用户对电子资源的访问下载情况而实施资源访问监控;周欣等[15]提出基于用户日志进行数据采集和数据挖掘的方法,构建用户行为分析系统模型。......
2023-07-24
本方案是基于内容的文献推荐方法,当用户浏览图书馆信息系统,点击感兴趣的文献链接时,系统查找与用户当前所点击的文献特征高相似度的文献,经过排名后实施推荐。本方案中用户兴趣建模和文献数据建模均采用“混合关联”方案,如图10.13所示。抽取图书数据库中的“书名”和“内容简介”,与论文数据库中的“篇名”和“中文摘要”等元数据实现关联。Spark库中有专用函数支持“相似性度量”关联的实现。......
2023-07-24
①应用Spark函数对馆藏书目库和论文库中的数据进行处理,共构成5组二元组,保存为RDD,见表10.5。图10.6基于“作者”的图书与论文关联三元组基于大规模图计算的排名技术。通过以下的API存取图书、论文等文献,以及完成反馈的动作。图10.8数据实时服务系统查询及显示技术。......
2023-07-24
针对各种不同类型的图书馆数据服务,开展图书馆大数据应用模式及其实证研究具有重要意义。国内学者近年来也开始讨论高校图书馆大数据应用模式和技术问题。因此,在本研究中将大规模网络分析方法和内存计算技术作为沟通图书馆数据应用需求和大数据应用的首选方法和重要技术工具,有着内在的必然性。......
2023-07-24
学术界和工业界对知识管理理论进行了深入而广泛的研究,然而迄今为止对知识管理涉及的具体内容及一般过程尚未形成统一认识。这里重点介绍图书情报领域专家的相关表述。其管理过程大致包括知识生产、组织、构建、检索、发现、分享、应用和创新等阶段。在知识经济的背景下,知识的发现、利用和创新是贯穿于高校图书馆各项业务工作的主线,知识管理理论也成为大数据时代图书馆大数据应用和服务的主要支撑理论。......
2023-07-24
图4.3论文数据库和图书数据库本体模型和聚合元数据关联。设有两篇论文的题名分别为:论文A:大数据时代数字图书馆面临的机遇和挑战论文B:大数据时代下图书馆的挑战及其应对策略按以下步骤计算它们的相似程度。......
2023-07-24
图书馆大数据应用必须密切结合图书馆大数据服务的需求,针对性地提出应用模式和解决方案,以促进图书馆大数据服务的真正落地。本书利用语义网这一工具和技术,融合语义网最新研究成果,提出一种基于语义网的学科知识服务模式。因此本书提出面向科研的高校图书馆电子资源使用统计模式。......
2023-07-24
基于大规模网络分析方法构建图书馆大数据应用模式,应用模式框架如图3.1所示。框架图包括高校图书馆大数据应用模式和支撑理论,实现方法,支撑技术以及云计算支撑环境四个部分。图3.1高校图书馆大数据应用模式框架结合用户需求,数据整合需要基于上述数据库对不同类型的数据进行融合并深度加工。Hadoop的软件开源特性能极大降低大数据应用成本,并迅速成为工业界和学界开展大数据应用研......
2023-07-24
相关推荐