创新团队面临的问题包括:“信息过载”问题。期刊论文的标准格式和写作规范、专利和软件著作权的范例和模板以及结题报告的撰写规则等需要查阅大量的资料,在此基础上,创新团队需要将实践成果进行系统总结和理论提高后,才能形成有价值的学术文献。......
2023-07-24
构建创新知识库,辅助创新实践选题。创新知识库是大学生创新实践活动过程中用于检索和查询的数据库。在创新实践选题阶段,及时、精准获取创新实践活动相关的历史研究资料、当前研究动态和研究前沿非常重要。大数据环境下,需要从包括互联网资源、各数据库商的电子资源以及图书资源等多来源和多格式的数据中获取信息,并有效融合构建成为统一的结构化知识库,以供检索和查询。
图9.1 面向大学生创新实践活动的图书馆大数据服务模式
近年来兴起的语义网和关联数据技术为数据的融合和检索提供了强大的技术支撑。语义网技术由万维网联盟W3C提出,以图为数据结构描述现实世界中的实体和链接关系。数据关联技术以语义网为基础,基于资源描述框架的组建规则,将各种异构的数据库有机链接起来,构建成语义关联的大数据。数据关联技术能够有效消除数据库中的冗余信息,并适合快速查询和精准检索。
创新素材收集和创新知识整合。创新知识库的数据来源包括学科专业数据库、在线百科、Web页面等。学科专业数据库是指通过签约方式(如中国知网、万方)获得使用权限的数据库,或者各图书馆自建的专业数据库(如本科生、研究生的毕业论文库,或通过网络爬虫实时爬取并结构化的专利库、各类学科竞赛的历年题库和解答等);在线百科是由相关领域专家编辑并反复完善而构建起来的有一定权威的知识库,库中包含大量结构化的学科知识,如百度百科、维基百科等;Web页面数据来源于互联网网页,包括文本、图片及音视频等海量信息(如各类创新实践项目的官方网页,学科竞赛相关报道等)。由于上述数据的多源、异构以及收集过程中难以避免的错误,这些数据在一定程度上含有“噪音”,容易出现冗余或缺失。ETL工具能够检查数据,并对数据去重、去错,以高效完成数据清洗。
有关高校图书馆大数据应用模式与实证研究的文章
创新团队面临的问题包括:“信息过载”问题。期刊论文的标准格式和写作规范、专利和软件著作权的范例和模板以及结题报告的撰写规则等需要查阅大量的资料,在此基础上,创新团队需要将实践成果进行系统总结和理论提高后,才能形成有价值的学术文献。......
2023-07-24
本方案是基于内容的文献推荐方法,当用户浏览图书馆信息系统,点击感兴趣的文献链接时,系统查找与用户当前所点击的文献特征高相似度的文献,经过排名后实施推荐。本方案中用户兴趣建模和文献数据建模均采用“混合关联”方案,如图10.13所示。抽取图书数据库中的“书名”和“内容简介”,与论文数据库中的“篇名”和“中文摘要”等元数据实现关联。Spark库中有专用函数支持“相似性度量”关联的实现。......
2023-07-24
所有的应用模式都是基于知识管理理论,并将知识管理过程中“知识生产、组织、构建、检索、发现、分享、应用和创新”的一系列过程凝练为“数据收集、整合与存储”“数据处理和分析”和“数据展现与服务”三个关键过程,并分别构建大数据应用子模式。表12.2图书馆大数据服务的对象、内容和大数据来源比较从表12.2的比较可以看出,在“数据收集、整合与存储”阶段,各类应用模式大都采用语义网和本体技术对大数据进行清洗和融合。......
2023-07-24
构建用户个性化模型、实现个性化推荐,缓解“信息过载”。根据以上分析,本研究拟基于本体和关联数据技术,构建用户行为模型,通过分析显性用户兴趣和隐性用户需求,提供大数据情景下的图书馆个性化服务。......
2023-07-24
“领域名称”关联与“中图法分类名”关联相加占关联二元组总数的比例达91%,共同构成整个关联的基石。关联分析结果表明,“评分规则制定”的相关分析,以及权重的设置,与大数据系统运行的实际结果相互印证,逻辑上也能得到合理的解读。......
2023-07-24
[6][7][8]具体到图书情报领域,图书馆文献推荐的研究主要集中在图书馆信息系统中推荐方法的应用。蓝冬梅[20]结合高校图书馆借阅记录,通过预测用户对各类图书的借阅偏好实施图书推荐,实验表明推荐的准确率和多样性同时得到提升。随着文献服务水平的不断提高和大数据技术的完善,图书馆文献推荐方法研究和实证分析也需要与时俱进。以下在分析大数据下图书馆文献推荐需求的基础上,提出两种不同的文献推荐方案。......
2023-07-24
①应用Spark函数对馆藏书目库和论文库中的数据进行处理,共构成5组二元组,保存为RDD,见表10.5。图10.6基于“作者”的图书与论文关联三元组基于大规模图计算的排名技术。通过以下的API存取图书、论文等文献,以及完成反馈的动作。图10.8数据实时服务系统查询及显示技术。......
2023-07-24
相关推荐