将云计算技术应用于通信网络,能够动态地将不同位置、实时产生的大规模数据分配到最合适的数据中心处理。如图12.11所示,云计算可部署在核心城域的大型数据中心,边缘计算可部署在城域汇聚或更低的位置中小型数据中心。因此,数据中心网络连接必须是可靠和安全的,必要情况下还要进行加密,以避免数据的泄露与丢失。......
2023-06-26
(一)联机编目的质量控制
为适应信息时代对图书馆的要求,使我国图书馆工作自动化、文献信息化、传输网络化,最大限度地实现资源共享,本着统一规划、统一标准、合作建设、协调管理的原则,北京图书馆作为国家图书馆,于1997年10月成立了“全国联合编目中心”(以下简称联合编目中心)。当时,全国共有45家各种类型的图书馆成为这一联合编目中心的成员馆,并且能够通过网络向联合编目中心数据库上传数据和下载中心的书目数据。
联合编目中心的宗旨是在全国范围内组织与管理图书馆联机联合编目工作,实现网上编目资源共享。联合编目中心的职能是:通过联机联合编目,降低成员馆与用户的编目成本,提高编目质量,实现书目数据的规范化、标准化,实现书目数据资源共享;通过编制联合目录,打破图书馆界条块分割的界限,形成地区性跨行业馆藏资源协调采访网络;通过采访协调,形成特色馆藏与馆藏互补;通过网上传输、馆际互借,实现馆藏资源共享,提高馆藏质量;通过组织成员馆之间的交流和培训,提高成员馆的业务水平、技术水平和服务水平,掌握国际国内图书馆发展的最新动态等。
联合编目中心的联机编目应用系统于1998年12月开始进行联通试验并开始试运行,书目数据的质量管理也开始成为各成员馆在工作中必须要关注的问题。
实际操作中最突出的问题还是书目数据的质量控制。由于对标准、规则理解上的差异,各编目员上传的数据质量难以保证,并且联合编目中心花在审校上的成本可能并不低于原编的成本。联合编目中心因此严格控制各成员馆的上传权限,很多成员馆就无权上传数据。几乎是与全国联合编目中心同一时期建立的另外一个联合编目中心,近年来也正在如火如荼地发展壮大,它就是中国高等教育文献保障系统(China Academic Library&Information System,简称CALIS)。CALIS是经国务院批准的我国高等教育“九五”“十五”总体规划中三个公共服务体系之一。CALIS的宗旨是:在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来,建设以中国高等教育数字图书馆为核心的教育文献联合保障体系,实现信息资源共建、共知、共享,以发挥最大的社会效益和经济效益,为中国的高等教育服务。
CALIS管理中心引进和共建了一系列国内外文献数据库,包括大量的二次文献库和全文数据库;采用独立开发与引用消化相结合的道路,主持开发了联机合作编目系统、文献传递与馆际互借系统、统一检索平台、资源注册与调度系统,形成了较为完整的CALIS文献信息服务网络。CALIS之所以能在短短几年间取得令人瞩目的成果,一个很重要的原因就在于它的运营模式。就联机合作编目方面而言,为了提高高校编目队伍的整体素质,确保高校图书馆书目数据库的质量,CALIS联机合作编目中心为编目员举办中、西文图书编目业务培训,主要内容为编目知识、著录规则等。中心还建立了中文三级编目员资格认证考试制度,考试合格者即可获得CALIS三级编目员资格,有权向编目中心提交自编的书目数据。在数据质量控制方面,CALIS也组织专家对各馆提交的数据进行审校,并将存在的问题及时反馈。经一定时间和一定方式的测评,达到要求的编目员或成员馆即可升级。
(二)书目数据质量控制的难点
联合编目的数据质量管理工作,在实践中存在着很多难点,最关键的就是操作中对数据标引质量的控制。造成数据质量有缺陷的原因如下。
计算机的应用大大丰富了原有的检索语言,造成了检索语言的不一致。检索语言的准确语法是数据库质量管理中的难点和要点。计算机的应用为体系分类法的改造和功能的发挥,为分类检索语言和主题检索语言的结合注入了无穷的活力。不论是检索语言的编制和修订,还是标引技术和检索技术的改进与改革,都必须彻底摆脱手工操作阶段所固有的思路和观念,否则就很难在数字化信息时代满足联机检索、联网检索对情报检索语言日益提高的要求。例如,在机读目录中,一条记录著录有书目文献的各种数据和多种检索语言,这些不同的检索语言也由原来的泾渭分明、相互对立,转变为相互渗透、相互结合、相互包含,它们之间的界限也变得越来越模糊。这是编目人员需要重新适应的。
编目人员对编目规则理解程度的差异,造成规则执行中的差异。编目人员对编目规则的理解程度不一,导致具体操作结果的差异。因而,对同一种文献的处理、制作的数据会有各式各样著录结果。目前,国内编目业尚无一部系统、权威的编目规则,造成了数据编制上的差异。这是目前国内编目工作的最大麻烦。各种可作为编目依据的规则,在一些关键的说法上均不统一,使得编目人员无所适从,有无“法”可依之感。因此,全国联合编目中心为保证数据库的质量,做到各成员馆送达的数据能够统一,对一些尚无定论的著录项目或数据字段做了统一的规定,要求各馆都按此执行。这样将来有统一的定论后,通过计算机处理,可以很容易达到著录格式的统一转换。
为了实施全国中文图书联合编目工作,确保网上中文机读书目数据的质量,北京图书馆图书采编部依据有关国际和国家标准,结合建库期间中文普通图书计算机编目的工作实践,编写了《中文普通图书编目手册》,并且以此作为全国联合编目中心中文图书联合编目的规则。
有关高校图书馆管理创新研究的文章
将云计算技术应用于通信网络,能够动态地将不同位置、实时产生的大规模数据分配到最合适的数据中心处理。如图12.11所示,云计算可部署在核心城域的大型数据中心,边缘计算可部署在城域汇聚或更低的位置中小型数据中心。因此,数据中心网络连接必须是可靠和安全的,必要情况下还要进行加密,以避免数据的泄露与丢失。......
2023-06-26
业务规则过少管理的重要原因是,将数据质量管理当作一次性工作,疏于发掘与扩张测定数据质量的业务规则。数据库的表和行列以物理数据模型呈现。图4-2数据模型2②业务规则2:商品交付单位表的商品交付合作单位代码是Not Null,且必须为在合作单位表中登录的公司。原因是作为业务规则1和业务规则2导出基础的数据模型2是物理数据模型,而物理数据模型要充分表现其数据业务特性是有局限性的。......
2023-11-16
这一阶段的数据中心须具有高可用性。在此背景下,结合云计算技术的云数据中心应运而生。业界正掀起新一轮的数据中心建设高潮,新一代的云数据中心随之而产生。在当前的云计算架构中,云数据中心是云计算硬件架构最底层的独立计算单位。另外,面向云数据中心的侧重点已由物理架构转向了提供标准化服务。......
2023-11-18
目前市场中所使用的与数据质量管理相关的核心技术有如下几种。2)设置文件这是数据质量管理的基础技术,不需经过与业务相关的特别事先培训,即可了解数据质量的基本情况,即为理解数据质量问题,取得各种有效统计的数据分析方法。与上述数据质量管理主要技术同样重要的是数据质量管理方法论。这不是使用区区几个技术就能够确保数据质量的,还需要专业咨询,采用适合各组织的流程,并提出各阶段的最佳运行和技术。......
2023-11-16
来自不同数据源的数据之间存在着冲突、不一致或相互矛盾的现象。数据量巨大,难以在合理时间内判断数据质量的好坏。数据变化速度快,数据“时效性”很短,对处理技术提出更高的要求。由于大数据的变化速度较快,有些数据的“时效性”很短。国内外没有形成统一认可的数据质量标准,对大数据数据质量的研究才刚刚起步。......
2023-06-23
因为没有大数据平台安全技术,所以应尽早解决此问题。网络应用程序、数据库的安全或大数据集群仍是安全保护的重要对象,需要保证大数据的保密性、可用性、完整性。与此同时,各个产业群中,致命的数据安全事故激增。大数据平台也成为重要的数据安全对象,针对数据的机密性、完整性、可用性的安全目标以及能够防御来自数据的掠夺、伪造等外部威胁的体系和标准测定模型图的开发是必要的。......
2023-11-16
最近以数据治理、数据法规遵守为题的项目渐渐增多,下面介绍几个企业进行数据质量管理的案例。在这类项目中,数据质量管理被认为是必要而必需的。而且数据质量管理在数据质量问题发生后的原因追查中,作为决定性因素,以减少项目数据层面的危险为目标实施。通过第1阶段初步质量管理标准可以看出我国企业的数据质量管理现状。目前为止,因受数据质量管理的几处制约,在IT组织中,投资优先顺序已下降。......
2023-11-16
数据质量非常重要,数据的不确定性或质量低下会带来很多弊端。数据质量管理会对企业的经营质量管理和信息系统质量管理产生直接的影响。除了将数据的准确性视为质量的基本标准,数据的快速提供、数据应用的方便性等也常被视为质量标准。最近全球出现的数据质量管理受法律强制规范的现象尤为突出。为达成这一目标,全面提高数据质量管理标准的重要性正在凸显,也相应提出了不少方案。数据难以管理的主要原因是相关对象繁多且复杂。......
2023-11-16
相关推荐