国内外专家学者对图书馆电子资源使用统计进行了多角度的研究和应用尝试。国内学者的研究主要集中在应用领域。钟克吟[13]利用ASP技术开发图书馆电子资源读者访问流量统计分析系统来提高数字资源服务效益;王政军[14]提出基于旁路监听技术的图书馆数字资源绩效分析的设计思路和方案,通过记录用户对电子资源的访问下载情况而实施资源访问监控;周欣等[15]提出基于用户日志进行数据采集和数据挖掘的方法,构建用户行为分析系统模型。......
2023-07-24
电子资源的采集模式包括两种方式,即由图书馆自主采集科研用户的使用日志和数据库商统一提供的电子资源使用统计报告,以满足不同用户的需求。
1.基于实名认证和IP绑定并结合旁路镜像监听采集用户行为日志
具体采集方法如图8.2所示,电子资源包括远程和本地两种形式,而用户类型有校内、校外和手机用户三种。除了校内用户访问本地电子资源是通过IP授权方式以外,其他各类访问都是采用实名认证的方式。对于实名认证方式,可以针对科研用户的实名账号从校园网络出口(用于远程电子资源)和校内交换机(用于本地资源)的网络流量中精准抓取用户访问日志[16];对于IP授权方式,需要将科研用户的账号和IP映射后绑定,以获取科研用户个体的日志数据。
图8.2 科研用户基于实名认证和IP授权两种方式访问电子资源
采集技术主要应用旁路镜像监听方法,如图8.3所示,利用校园网出口或校园网内交换机端口的镜像功能,将采集设备以旁路方式连接加以采集。依据相关采集参数(数据库名、资源URL和IP地址、科研用户账号等)过滤网络镜像数据流,将结果传输到数据统计服务器上。这种旁路方式的优点是在不改变校园网的原始架构和不影响校园网络速度和性能的基础上,能得到真实有效的用户日志数据。由于各数据库的多源、异构以及采集过程中难以避免的错误,这些日志数据一定程度上含有“噪音”,需要进行清洗,即使用相关工具(如Extraction Transformation and Loading,抽取、转化和装载工具)对数据进行过滤和检查,并对数据去重、纠错和合并。[17]
图8.3 旁路镜像方式数据采集方案的实现原理
2.基于Counter规范由各数据库商统一提供远程电子资源使用的统计报告
为帮助图书馆获取可靠、一致和兼容的电子资源统计标准,Counter项目组自2002年以来发布了《Counter期刊和数据库实施规范》,目前已经升级到第四版(Counter R4),该规范明确定义了包含在线期刊、数据库、在线图书及多媒体等电子资源使用的统计规范,例如规定统计的关键指标应包含“登录次数、检索次数、全文下载量和拒绝访问量”等[18]。Counter规范目前获得了大部分国际著名数据库商的支持,图书馆在使用这些外文的数据库时,可以通过标准的收割接口SUSHI(Standardized Usage Statistics Harvesting Initiative)获取统计报告。
Counter规范的优缺点分析。Counter优点在于:采用统一的指标和规范提供面向宏观层面的统计报告,如某用户(购买该资源的图书馆所在高校的所有用户集合)在某一时间段访问该数据库的请求量、全文下载(被拒)量等,有利于科研团体或管理部门掌握宏观统计数据。Counter缺点在于:
(1)只能获取各数据库商提供的统计报告,而对各图书馆的馆藏资源和免费资源的使用情况无能为力。
(2)Counter报告只能从宏观上给出所有用户访问该数据商资源的统计数据,无法提交面向科研个体细致的“内容级/用户级”报告,从而不能满足用户个性化的要求。
(3)国内的数据库商基本不支持Counter计量标准。[19]
由于采用“实名认证”和“IP绑定”方法,图书馆能够方便地采集包含国内外各种类型资源以及面向用户个体的用户日志,能够弥补Counter规范的上述缺点,因此将上述两种方法结合起来,即以图书馆自行采集数据服务于科研用户,以数据库商的统计报告服务于科研团体的共享需要和管理部门的宏观决策,从而全面满足各级科研用户的需求。
有关高校图书馆大数据应用模式与实证研究的文章
国内外专家学者对图书馆电子资源使用统计进行了多角度的研究和应用尝试。国内学者的研究主要集中在应用领域。钟克吟[13]利用ASP技术开发图书馆电子资源读者访问流量统计分析系统来提高数字资源服务效益;王政军[14]提出基于旁路监听技术的图书馆数字资源绩效分析的设计思路和方案,通过记录用户对电子资源的访问下载情况而实施资源访问监控;周欣等[15]提出基于用户日志进行数据采集和数据挖掘的方法,构建用户行为分析系统模型。......
2023-07-24
本研究通过分析电子资源的特点和影响其利用的主要因素,探讨了提高国防研究型大学图书馆电子资源利用率的策略。而目前,高校图书馆电子资源的宣传导读教育多数由专门的信息咨询部门负责,形成了宣传导读教育的单一化、专属化。这些无疑增加了用户的使用负担,影响了电子资源的使用效率。......
2023-11-29
国防研究型大学数字图书馆是建立在原有的实体图书馆的基础上的,是实体图书馆的重要组成部分,数字图书馆电子资源建设不能与原有的实体图书馆割裂开。国防研究型大学数字图书馆应针对学校的科研方向和学科专业进行电子资源的建设。(五)标准化原则标准化原则是提高国防研究型大学数字图书馆电子资源建设质量的一个关键环节。......
2023-11-29
其中“科研用户身份信息表”描述各类科研用户实名认证信息;“科研用户访问电子资源日志表”描述科研用户访问电子资源的个性化行为,存放清洗后的用户日志,用于“内容级/用户级”的分析和挖掘;“电子资源访问日志汇总表”来源于各数据库商的统计数据,存储融合和集成后的宏观统计信息。......
2023-07-24
多校区模式下高校图书馆文献资源的布局与管理[1]贾宇群李桂祥刘东燕摘要:高校合并及新校区的兴建,使得多校区大学成为普遍现象。但也面临着文献资源的合理布局与科学管理等新问题。本文主要讲述的也是这种总分馆制管理模式的多校区多馆制文献资源的布局与管理。特色馆藏不仅反映一个图书馆藏书的重点,而且也代表馆藏文献的特色。......
2023-11-29
近年来,随着全省经济和高等教育的进一步繁荣,海南省高校图书馆获得了长足的发展。下面笔者将就海南省高校图书馆馆藏传统文献的收藏现状进行分析。笔者2011年2月间对海南省高校图书馆网站的访问情......
2023-07-30
基于大规模网络分析方法构建图书馆大数据应用模式,应用模式框架如图3.1所示。框架图包括高校图书馆大数据应用模式和支撑理论,实现方法,支撑技术以及云计算支撑环境四个部分。图3.1高校图书馆大数据应用模式框架结合用户需求,数据整合需要基于上述数据库对不同类型的数据进行融合并深度加工。Hadoop的软件开源特性能极大降低大数据应用成本,并迅速成为工业界和学界开展大数据应用研......
2023-07-24
3学科馆员的服务模式学科馆员虽然具备以上五个方面的职能,但是在具体的实施中,其服务却因馆员综合能力、馆情等多种因素的不同而有所差异。笔者根据国内学科馆员的发展现状,提出以下学科馆员的服务模式。......
2023-11-30
相关推荐