所有的应用模式都是基于知识管理理论,并将知识管理过程中“知识生产、组织、构建、检索、发现、分享、应用和创新”的一系列过程凝练为“数据收集、整合与存储”“数据处理和分析”和“数据展现与服务”三个关键过程,并分别构建大数据应用子模式。表12.2图书馆大数据服务的对象、内容和大数据来源比较从表12.2的比较可以看出,在“数据收集、整合与存储”阶段,各类应用模式大都采用语义网和本体技术对大数据进行清洗和融合。...
2023-07-24 理论教育
所有的应用模式都是基于知识管理理论,并将知识管理过程中“知识生产、组织、构建、检索、发现、分享、应用和创新”的一系列过程凝练为“数据收集、整合与存储”“数据处理和分析”和“数据展现与服务”三个关键过程,并分别构建大数据应用子模式。表12.2图书馆大数据服务的对象、内容和大数据来源比较从表12.2的比较可以看出,在“数据收集、整合与存储”阶段,各类应用模式大都采用语义网和本体技术对大数据进行清洗和融合。...
2023-07-24 理论教育
①应用Spark函数对馆藏书目库和论文库中的数据进行处理,共构成5组二元组,保存为RDD,见表10.5。图10.6基于“作者”的图书与论文关联三元组基于大规模图计算的排名技术。通过以下的API存取图书、论文等文献,以及完成反馈的动作。图10.8数据实时服务系统查询及显示技术。...
2023-07-24 理论教育
图书馆大数据应用必须密切结合图书馆大数据服务的需求,针对性地提出应用模式和解决方案,以促进图书馆大数据服务的真正落地。本书利用语义网这一工具和技术,融合语义网最新研究成果,提出一种基于语义网的学科知识服务模式。因此本书提出面向科研的高校图书馆电子资源使用统计模式。...
2023-07-24 理论教育
利用大数据挖掘技术来优化算法,可进一步提高各种个性化服务质量,提升高校师生及相关工作人员的满意度。一方面,可以利用Mahout提供的主成分分析、奇异值分解等降维方法进行数据降维,以帮助解决高校图书馆大数据的高维度问题;另一方面,可以利用Mahout中已实现的相关算法来实现个性化服务。...
2023-07-24 理论教育
构建创新知识库,辅助创新实践选题。图9.1面向大学生创新实践活动的图书馆大数据服务模式近年来兴起的语义网和关联数据技术为数据的融合和检索提供了强大的技术支撑。语义网技术由万维网联盟W3C提出,以图为数据结构描述现实世界中的实体和链接关系。数据关联技术以语义网为基础,基于资源描述框架的组建规则,将各种异构的数据库有机链接起来,构建成语义关联的大数据。...
2023-07-24 理论教育
构建用户个性化模型、实现个性化推荐,缓解“信息过载”。根据以上分析,本研究拟基于本体和关联数据技术,构建用户行为模型,通过分析显性用户兴趣和隐性用户需求,提供大数据情景下的图书馆个性化服务。...
2023-07-24 理论教育
Spark框架的软件栈如图2.1所示。Spark SQL是Spark用来操作结构化数据的程序包,支持多种数据源,主要用于查询数据。Spark Streaming的功能是对实时数据进行流式计算,如生产过程中的网页服务器日志或是网络服务中用户提交状态更新的消息队列等,Spark提供了该类操作的API接口,并与Spark Core中的RDD API接口相对应,这使得编程人员能方便操作内存、硬盘数据和实时数据流。...
2023-07-24 理论教育
大数据环境下个性化服务的研究引起学界重视。大数据技术的迅速发展以及图书馆个性化服务要求的不断提高,催生了大数据环境下个性化服务的研究,尤其是在关联数据技术与个性化服务结合方面取得了积极进展。以下结合大数据环境下个性化服务特征,讨论用户行为模型的构建策略。...
2023-07-24 理论教育
针对各种不同类型的图书馆数据服务,开展图书馆大数据应用模式及其实证研究具有重要意义。国内学者近年来也开始讨论高校图书馆大数据应用模式和技术问题。因此,在本研究中将大规模网络分析方法和内存计算技术作为沟通图书馆数据应用需求和大数据应用的首选方法和重要技术工具,有着内在的必然性。...
2023-07-24 理论教育
关联规则是数据挖掘领域中的重要算法,经典的关联规则算法广泛应用于零售领域的购物篮分析。在高校图书馆个性化服务中,关联规则可以用来发现用户使用文献之间的关系,发现同时被频繁使用的文献,从而帮助系统在用户浏览、下载、借阅时向其推荐相关文献。...
2023-07-24 理论教育
其中“科研用户身份信息表”描述各类科研用户实名认证信息;“科研用户访问电子资源日志表”描述科研用户访问电子资源的个性化行为,存放清洗后的用户日志,用于“内容级/用户级”的分析和挖掘;“电子资源访问日志汇总表”来源于各数据库商的统计数据,存储融合和集成后的宏观统计信息。...
2023-07-24 理论教育
目前,以本体和语义网技术为基础的知识图谱的研究近期引起图书情报学界的重视,如何将知识图谱最新成果应用于高校图书馆大数据服务是本领域未来研究应密切关注的方向。...
2023-07-24 理论教育
学术界和工业界对知识管理理论进行了深入而广泛的研究,然而迄今为止对知识管理涉及的具体内容及一般过程尚未形成统一认识。这里重点介绍图书情报领域专家的相关表述。其管理过程大致包括知识生产、组织、构建、检索、发现、分享、应用和创新等阶段。在知识经济的背景下,知识的发现、利用和创新是贯穿于高校图书馆各项业务工作的主线,知识管理理论也成为大数据时代图书馆大数据应用和服务的主要支撑理论。...
2023-07-24 理论教育
应用数据挖掘技术有助于解决高校图书馆大数据应用中的知识迷航和信息过载问题。李艳等[13]从宏观上研究了高校图书馆大数据挖掘与决策分析体系,设计了基于高校图书馆特点的体系架构模型与业务分析流程,并探讨该体系架构在个性化服务中的应用。Yi C等[14]提出将数据挖掘算法应用到高校图书馆大数据个性化推送服务,着重讨论了关联规则算法和聚类算法的应用。...
2023-07-24 理论教育
在图7.2的图书馆大数据存储层,Hadoop HDFS提供了最基本的持久化分布式文件系统。Hadoop HDFS适于存储数据查询和处理要求不高的信息,例如图书馆界近一年的重大新闻集合。HBase的列式存储便于数据定义的随时更改,且适于大规模本体数据、知识库和知识图谱的存储、查询。Mongo DB的嵌入式文档则支持复杂的层级结构,为格式不一的各类社交文本大数据的存储提供了更高的灵活性。...
2023-07-24 理论教育
图书馆大数据具体应用模式的比较和分析。一方面,由于图书馆大数据应用服务的对象不同,导致服务的目的、要求、数据来源、数据特点有很大差异,所提出的高校图书馆大数据各种应用模式也有重大区别;另一方面,各种模式也存在诸多共同点,因此需要对其进行比较和分析。...
2023-07-24 理论教育