图书馆大数据应用必须密切结合图书馆大数据服务的需求,针对性地提出应用模式和解决方案,以促进图书馆大数据服务的真正落地。本书利用语义网这一工具和技术,融合语义网最新研究成果,提出一种基于语义网的学科知识服务模式。因此本书提出面向科研的高校图书馆电子资源使用统计模式。......
2025-09-29
数据挖掘技术是高效利用数据、发现价值的一种信息技术,也是知识发现的一个重要步骤。数据本身隐含价值,数据挖掘技术能发现知识和规律,最后通过应用实现价值。应用数据挖掘技术有助于解决高校图书馆大数据应用中的知识迷航和信息过载问题。李文阔等[10]评述了数据挖掘在数据体量有限的数字图书馆读者分析、资源建设和个性化服务等方面的研究和应用。Zhai Z P[11]将关联规则算法应用于高校图书馆个性化服务系统的用户日志挖掘。然而,大数据具有种类多(variety)、流量大(Velocity)、容量大(Volume)和价值高(Value)的“4V”特征,这些特征决定了大数据挖掘技术有别于之前的数据挖掘技术。常雅红[12]分析了大数据环境下图书馆系统的开放式结构、移动互联体系以及信息化服务模式,提出了基于大数据挖掘的图书馆服务新模式,包括客户定制化服务和移动服务模式。李艳等[13]从宏观上研究了高校图书馆大数据挖掘与决策分析体系,设计了基于高校图书馆特点的体系架构模型与业务分析流程,并探讨该体系架构在个性化服务中的应用。
Yi C等[14]提出将数据挖掘算法应用到高校图书馆大数据个性化推送服务,着重讨论了关联规则算法和聚类算法的应用。本节根据大数据环境下高校图书馆个性化服务的应用需求,分析个性化推荐、检索、推送的特点、区别和联系,并着重讨论大数据挖掘算法在提高基础推荐算法精准性、新颖性等方面的应用,最后给出面向高校图书馆个性化服务的基于Hadoop云计算平台的大数据挖掘实现方案。(https://www.chuimin.cn)
相关文章
图书馆大数据应用必须密切结合图书馆大数据服务的需求,针对性地提出应用模式和解决方案,以促进图书馆大数据服务的真正落地。本书利用语义网这一工具和技术,融合语义网最新研究成果,提出一种基于语义网的学科知识服务模式。因此本书提出面向科研的高校图书馆电子资源使用统计模式。......
2025-09-29
图4.3论文数据库和图书数据库本体模型和聚合元数据关联。设有两篇论文的题名分别为:论文A:大数据时代数字图书馆面临的机遇和挑战论文B:大数据时代下图书馆的挑战及其应对策略按以下步骤计算它们的相似程度。......
2025-09-29
基于大规模网络分析方法构建图书馆大数据应用模式,应用模式框架如图3.1所示。框架图包括高校图书馆大数据应用模式和支撑理论,实现方法,支撑技术以及云计算支撑环境四个部分。图3.1高校图书馆大数据应用模式框架结合用户需求,数据整合需要基于上述数据库对不同类型的数据进行融合并深度加工。Hadoop的软件开源特性能极大降低大数据应用成本,并迅速成为工业界和学界开展大数据应用研......
2025-09-29
究其原因,高校图书馆大数据应用正处于起步阶段,数据收集整合、数据分析和知识服务方法有待发展,相关技术有待突破;另外,高校图书馆数据量激增,海量存储的急切需求和计算设备性能的急待提高与资金投入受限也存在尖锐的矛盾。上述因素使得当前高校图书馆大数据应用陷入困境,阻碍了高校图书馆大数据服务的开展。大数据实时处理和高效分析是图书馆知识服务的前提,也是图书馆大数据应用落地的关键。......
2025-09-29
Spark框架的软件栈如图2.1所示。Spark SQL是Spark用来操作结构化数据的程序包,支持多种数据源,主要用于查询数据。Spark Streaming的功能是对实时数据进行流式计算,如生产过程中的网页服务器日志或是网络服务中用户提交状态更新的消息队列等,Spark提供了该类操作的API接口,并与Spark Core中的RDD API接口相对应,这使得编程人员能方便操作内存、硬盘数据和实时数据流。......
2025-09-29
两类数据均截至2016年12月31日。首先是Spark关联计算,将馆藏图书数据库和论文数据库聚合,构建RDD关联三元组,然后转换为GraphX图计算,实现对关联结果排名并保存到数据库中,最后开发Web实时系统显示文献查询结果。其中,“图书与图书”通过“中图法分类名”关联的三元组数目最大,达到14亿多条。这两类关联占三元组总数的比例近95%,共同构成“字符比较”关联的主体部分。这是因为计算过程中Spark中间结果存储在内存中,提高了性能。......
2025-09-29
针对各种不同类型的图书馆数据服务,开展图书馆大数据应用模式及其实证研究具有重要意义。国内学者近年来也开始讨论高校图书馆大数据应用模式和技术问题。因此,在本研究中将大规模网络分析方法和内存计算技术作为沟通图书馆数据应用需求和大数据应用的首选方法和重要技术工具,有着内在的必然性。......
2025-09-29
基于社会网络分析的图数据挖掘在网络社区划分、社会网络特性分析以及预测未来的社交行为等方面有着极其广泛的应用。由于SNA方法在知识检索中注重导入“人”与知识的互动关系,如通过复杂社会网络的时序挖掘、中心性演化等分析技术的应用,从而助力隐性知识向显性知识转化。......
2025-09-29
相关推荐