作为大数据时代产物的“Google知识图谱”,紧密依存大数据理论,以及关注数据规范性和关联性的本体和语义网理论。“科学知识图谱”本质是知识管理的分析方法,一般较少涉及知识存储过程。“Google知识图谱”本质是以语义三元组为基础的结构化海量知识库。依据知识应用目的可以分为通用知识图谱和行业知识图谱,见表12.1。“科学知识图谱”侧重于知识共享,兼具知识创新功能;而“Google知识图谱”则只偏重于知识创新。......
2023-07-24
随着资源数字化进程的急速推进,众多领域的数字资源具有数据增加迅速,总数据量大,种类繁多且价值密度低等大数据特征,这将会给两类知识图谱在知识管理各阶段的相互关系及未来发展产生明显影响。
1.知识获取和组织阶段的相互借鉴
“科学知识图谱”的数据一般依赖于现成的数据库获取知识,并在此基础上构建网络模型组织知识。海量数据下,特别是关联数据技术已成为数据库技术发展的潮流,借助多种数据库关联,能更加全面地融合各种知识和产生创新型知识。因此借鉴“Google知识图谱”的理念,从互联网和云计算系统中收集数据,以及关联多种异构数据库来构建知识库,是大数据时代“科学知识图谱”获取知识的重要手段;另一方面,在社会网络建模过程中,融入语义网的构建方法,在不同的节点间嵌入强语义关联,能够使得社会网络具有推理能力,实现网络分析的智能化。
“Google知识图谱”可以借鉴“科学知识图谱”中的社会网络分析方法,如中心性、凝聚子群和核心-边缘结构等方法,从上述多个角度分析语义网实体之间的结构和关系,从而有利于全面解析语义网的特征。
2.知识存储和共享阶段的各自发展
“科学知识图谱”区别于“Google知识图谱”的重要功能在于能通过网络分析发现社团和社团中的关键人物,基于网络路径分析方法实现社团中成员的知识共享。在大数据环境下,社团规模急剧扩大,可以达到百万以上的级别。大规模社会网络分析对计算机硬件以及相关算法的性能将提出更高的要求,可以预见,基于分布式计算机集群的云计算技术将会成为“科学知识图谱”大规模网络分析的主要手段。
“Google知识图谱”需要建立知识库,以存储海量的结构化语义网知识,基于分布式存储技术以取得更大存储容量;另外,优化分布式数据库的增、删、改、查以获取更优的管理性能是当前迫切需要解决的问题,代表技术如Hadoop平台上的分布数据库NoSQL技术等。
3.知识创新阶段的深度融合
应用数据挖掘算法从网络中发现知识是知识创新的重要手段,由于两类知识图谱在分析方法上同属于网络分析范畴,有关网络分析算法和工具能够相互通用并深度融合。针对海量数据挖掘的聚类和关联挖掘等属于“Google知识图谱”的机器学习算法,可以集成到“科学知识图谱”相关的软件工具中,以提高算法和工具分析性能;另外,“Google知识图谱”可以利用“科学知识图谱”中的可视化算法和工具展现大规模语义网,清晰显示海量知识实体之间的复杂关系。
有关高校图书馆大数据应用模式与实证研究的文章
作为大数据时代产物的“Google知识图谱”,紧密依存大数据理论,以及关注数据规范性和关联性的本体和语义网理论。“科学知识图谱”本质是知识管理的分析方法,一般较少涉及知识存储过程。“Google知识图谱”本质是以语义三元组为基础的结构化海量知识库。依据知识应用目的可以分为通用知识图谱和行业知识图谱,见表12.1。“科学知识图谱”侧重于知识共享,兼具知识创新功能;而“Google知识图谱”则只偏重于知识创新。......
2023-07-24
构建创新知识库,辅助创新实践选题。图9.1面向大学生创新实践活动的图书馆大数据服务模式近年来兴起的语义网和关联数据技术为数据的融合和检索提供了强大的技术支撑。语义网技术由万维网联盟W3C提出,以图为数据结构描述现实世界中的实体和链接关系。数据关联技术以语义网为基础,基于资源描述框架的组建规则,将各种异构的数据库有机链接起来,构建成语义关联的大数据。......
2023-07-24
本方案是基于内容的文献推荐方法,当用户浏览图书馆信息系统,点击感兴趣的文献链接时,系统查找与用户当前所点击的文献特征高相似度的文献,经过排名后实施推荐。本方案中用户兴趣建模和文献数据建模均采用“混合关联”方案,如图10.13所示。抽取图书数据库中的“书名”和“内容简介”,与论文数据库中的“篇名”和“中文摘要”等元数据实现关联。Spark库中有专用函数支持“相似性度量”关联的实现。......
2023-07-24
创新团队面临的问题包括:“信息过载”问题。期刊论文的标准格式和写作规范、专利和软件著作权的范例和模板以及结题报告的撰写规则等需要查阅大量的资料,在此基础上,创新团队需要将实践成果进行系统总结和理论提高后,才能形成有价值的学术文献。......
2023-07-24
所有的应用模式都是基于知识管理理论,并将知识管理过程中“知识生产、组织、构建、检索、发现、分享、应用和创新”的一系列过程凝练为“数据收集、整合与存储”“数据处理和分析”和“数据展现与服务”三个关键过程,并分别构建大数据应用子模式。表12.2图书馆大数据服务的对象、内容和大数据来源比较从表12.2的比较可以看出,在“数据收集、整合与存储”阶段,各类应用模式大都采用语义网和本体技术对大数据进行清洗和融合。......
2023-07-24
然而,虚拟的网络世界烦冗复杂,网络文化往往混杂着种种不良信息,严重污染高校图书馆信息安全环境。高校图书馆的信息发布功能被大量的不良信息所利用,成为其传播的媒介和平台。这种情形严重干扰了图书馆正常的信息发布工作。(三)数据网络安全问题由于大数据更多的是基于一种网络数据服务的模式,网络节点的不断增加,网络安全对其将是一个严峻挑战。......
2023-07-06
读者的需求,有时并不总是看得见摸得着的,因此在大数据时代,高校图书馆要想在竞争中立于不败之地,就必须先培养大数据的思维。(三)健全保障机制,确保数据安全大数据研究在提升高校图书馆读者服务质量方面具有广阔的前景,大数据资源将成为高校图书馆的核心资产。这样才能确保我国高校图书馆进行合理、合法的数据信息利用和传播,从而实现既充分发挥大数据的优势,又不侵犯用户隐私的共赢目标。......
2023-07-06
3.网络环境下对高校图书馆服务的几点建议3.1改变信息资源结构,加大文献资源数字化配置结构的改变就是要合理配置纸质资源和电子资源。......
2024-08-31
相关推荐