首页 理论教育高校图书馆大数据应用: 文献推荐研究现状

高校图书馆大数据应用: 文献推荐研究现状

【摘要】:[6][7][8]具体到图书情报领域,图书馆文献推荐的研究主要集中在图书馆信息系统中推荐方法的应用。蓝冬梅[20]结合高校图书馆借阅记录,通过预测用户对各类图书的借阅偏好实施图书推荐,实验表明推荐的准确率和多样性同时得到提升。随着文献服务水平的不断提高和大数据技术的完善,图书馆文献推荐方法研究和实证分析也需要与时俱进。以下在分析大数据下图书馆文献推荐需求的基础上,提出两种不同的文献推荐方案。

国内外学界在个性化推荐领域的研究非常踊跃,相关文献及综述较为丰富。[6][7][8]具体到图书情报领域,图书馆文献推荐的研究主要集中在图书馆信息系统中推荐方法的应用。

1.推荐方法类型

文献推荐方法一般涉及两个要素:文献资源和用户数据。一般需要在分析用户偏好的基础上推荐文献资源。主流的推荐方法包括基于内容、协同过滤和混合推荐三种类型。其中基于内容的推荐先分析用户感兴趣的文献和数据库中其他文献在内容上的相似度,再选择高相似度的文献实现推荐[9][10][11];协同过滤推荐则需要分析用户历史偏好或兴趣,实现偏好高相似的用户或内容高相似的文献之间相互推荐;混合推荐将目标用户个体偏好和各类资源的相似度分析融合起来实施推荐。

2.推荐方法应用

(1)国内外学界密切结合用户或文献的各种特征,将数据分析和挖掘算法引入推荐以提升推荐性能。如Tsuji K等[12]采用支持向量机方法对用户借阅日志和图书主题挖掘和分类,开发推荐系统并评估推荐效果;张闪闪等[13]依据中图法分类体系对图书归类,设计自动化评分规则来实现推荐;宋楚平[14]提出一种协同过滤改进方法,基于图书分类生成用户评价矩阵,将用户特征和图书特征纳入用户相似度计算,以提高推荐准确率和用户满意率;凌霄娥等[15]利用改进的K-medoids方法对用户和图书构建决策树分类模型,辅助分析用户的图书借阅偏好以实现推荐;李宇航等[16]借鉴迁移学习概念,构建跨域协同过滤模型,实现对用户多个领域的兴趣挖掘和个性化推荐。

(2)学界关注如何在保证推荐准确率基础上,兼顾推荐多样性的研究。如安维等[17]综述了提高推荐系统多样性的相关研究,认为不能“盲目崇拜”准确率,应该适当考虑多样性;Musto C等[18]从开放的关联数据“云”上(Linked of Data Cloud)免费获取知识库,结合图计算技术搭建图书推荐系统,并在DBbook图书数据集[19]上测试,实验评估结果表明,该系统能兼顾推荐的多样性和准确率。蓝冬梅[20]结合高校图书馆借阅记录,通过预测用户对各类图书的借阅偏好实施图书推荐,实验表明推荐的准确率和多样性同时得到提升。

(3)针对海量文献数据的挑战,学界也将云计算和Hadoop的分布式平台引入推荐系统,从改善计算设备软硬件性能的角度来提高文献分析效率。肖强等[21]改进传统的协同过滤算法,使之适应Hadoop平台上的分布式计算,并予以实验分析;赵彦辉等[22]分析用户借阅日志以获取借阅偏好值,搭建Hadoop分布式平台并运用MapReduce算法,测试系统性能与图书推荐效果的关系。奉国和等[23]针对单机系统上的推荐算法性能及推荐的准确率都很低下的问题,采用Hadoop分布式平台+Mahout引擎技术改进协同过滤算法,提高了推荐的准确率。

国内外学界在相关领域开展了积极研究,做了众多有价值的工作,主要集中在将不同的分析算法和分布式平台引入文献推荐,以提高准确率和多样性等指标。随着文献服务水平的不断提高和大数据技术的完善,图书馆文献推荐方法研究和实证分析也需要与时俱进。以下在分析大数据下图书馆文献推荐需求的基础上,提出两种不同的文献推荐方案。