首页 理论教育数据质量管理及其挑战:联合编目中心的实践

数据质量管理及其挑战:联合编目中心的实践

【摘要】:联合编目中心的联机编目应用系统于1998年12月开始进行联通试验并开始试运行,书目数据的质量管理也开始成为各成员馆在工作中必须要关注的问题。在数据质量控制方面,CALIS也组织专家对各馆提交的数据进行审校,并将存在的问题及时反馈。造成数据质量有缺陷的原因如下。检索语言的准确语法是数据库质量管理中的难点和要点。

(一)联机编目的质量控制

为适应信息时代对图书馆的要求,使我国图书馆工作自动化、文献信息化、传输网络化,最大限度地实现资源共享,本着统一规划、统一标准、合作建设、协调管理的原则,北京图书馆作为国家图书馆,于1997年10月成立了“全国联合编目中心”(以下简称联合编目中心)。当时,全国共有45家各种类型的图书馆成为这一联合编目中心的成员馆,并且能够通过网络向联合编目中心数据库上传数据和下载中心的书目数据。

联合编目中心的宗旨是在全国范围内组织与管理图书馆联机联合编目工作,实现网上编目资源共享。联合编目中心的职能是:通过联机联合编目,降低成员馆与用户的编目成本,提高编目质量,实现书目数据的规范化、标准化,实现书目数据资源共享;通过编制联合目录,打破图书馆界条块分割的界限,形成地区性跨行业馆藏资源协调采访网络;通过采访协调,形成特色馆藏与馆藏互补;通过网上传输、馆际互借,实现馆藏资源共享,提高馆藏质量;通过组织成员馆之间的交流和培训,提高成员馆的业务水平、技术水平和服务水平,掌握国际国内图书馆发展的最新动态等。

联合编目中心的联机编目应用系统于1998年12月开始进行联通试验并开始试运行,书目数据的质量管理也开始成为各成员馆在工作中必须要关注的问题。

实际操作中最突出的问题还是书目数据的质量控制。由于对标准、规则理解上的差异,各编目员上传的数据质量难以保证,并且联合编目中心花在审校上的成本可能并不低于原编的成本。联合编目中心因此严格控制各成员馆的上传权限,很多成员馆就无权上传数据。几乎是与全国联合编目中心同一时期建立的另外一个联合编目中心,近年来也正在如火如荼地发展壮大,它就是中国高等教育文献保障系统(China Academic Library&Information System,简称CALIS)。CALIS是经国务院批准的我国高等教育“九五”“十五”总体规划中三个公共服务体系之一。CALIS的宗旨是:在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来,建设以中国高等教育数字图书馆为核心的教育文献联合保障体系,实现信息资源共建、共知、共享,以发挥最大的社会效益和经济效益,为中国的高等教育服务。

CALIS管理中心引进和共建了一系列国内外文献数据库,包括大量的二次文献库和全文数据库;采用独立开发与引用消化相结合的道路,主持开发了联机合作编目系统、文献传递与馆际互借系统、统一检索平台、资源注册与调度系统,形成了较为完整的CALIS文献信息服务网络。CALIS之所以能在短短几年间取得令人瞩目的成果,一个很重要的原因就在于它的运营模式。就联机合作编目方面而言,为了提高高校编目队伍的整体素质,确保高校图书馆书目数据库的质量,CALIS联机合作编目中心为编目员举办中、西文图书编目业务培训,主要内容为编目知识、著录规则等。中心还建立了中文三级编目员资格认证考试制度,考试合格者即可获得CALIS三级编目员资格,有权向编目中心提交自编的书目数据。在数据质量控制方面,CALIS也组织专家对各馆提交的数据进行审校,并将存在的问题及时反馈。经一定时间和一定方式的测评,达到要求的编目员或成员馆即可升级。

(二)书目数据质量控制的难点

联合编目的数据质量管理工作,在实践中存在着很多难点,最关键的就是操作中对数据标引质量的控制。造成数据质量有缺陷的原因如下。

计算机的应用大大丰富了原有的检索语言,造成了检索语言的不一致。检索语言的准确语法是数据库质量管理中的难点和要点。计算机的应用为体系分类法的改造和功能的发挥,为分类检索语言和主题检索语言的结合注入了无穷的活力。不论是检索语言的编制和修订,还是标引技术和检索技术的改进与改革,都必须彻底摆脱手工操作阶段所固有的思路和观念,否则就很难在数字化信息时代满足联机检索、联网检索对情报检索语言日益提高的要求。例如,在机读目录中,一条记录著录有书目文献的各种数据和多种检索语言,这些不同的检索语言也由原来的泾渭分明、相互对立,转变为相互渗透、相互结合、相互包含,它们之间的界限也变得越来越模糊。这是编目人员需要重新适应的。

编目人员对编目规则理解程度的差异,造成规则执行中的差异。编目人员对编目规则的理解程度不一,导致具体操作结果的差异。因而,对同一种文献的处理、制作的数据会有各式各样著录结果。目前,国内编目业尚无一部系统、权威的编目规则,造成了数据编制上的差异。这是目前国内编目工作的最大麻烦。各种可作为编目依据的规则,在一些关键的说法上均不统一,使得编目人员无所适从,有无“法”可依之感。因此,全国联合编目中心为保证数据库的质量,做到各成员馆送达的数据能够统一,对一些尚无定论的著录项目或数据字段做了统一的规定,要求各馆都按此执行。这样将来有统一的定论后,通过计算机处理,可以很容易达到著录格式的统一转换。

为了实施全国中文图书联合编目工作,确保网上中文机读书目数据的质量,北京图书馆图书采编部依据有关国际和国家标准,结合建库期间中文普通图书计算机编目的工作实践,编写了《中文普通图书编目手册》,并且以此作为全国联合编目中心中文图书联合编目的规则。