首页 百科知识网络信息资源分类及组织研究成果

网络信息资源分类及组织研究成果

【摘要】:在当前网络信息资源在社会信息资源中的比重日趋上升并逐渐成为国民经济和社会发展的基础性和战略性资源的背景下,研究网络信息资源的分类组织意义更显重大。

黑体, SimHei; font-size: 22px; color: rgb(255, 0, 0);">网络信息资源的分类组织研究

内蒙古河套大学图书馆 何桂芝

摘  要:作为组织知识集合的基本方式、知识组织的工具之一,分类组织法的特性使其最有可能成为国际通用信息检索语言,成为跨世纪网络信息资源组织与揭示的工具。本文分析了分类法组织揭示网络信息资源的优势以及文献分类法、网络分类法、分众分类法在现有网络信息资源组织中的应用。

关键词:网络信息资源  信息组织  文献分类法  网络分类法  分众分类法  本体论

AbstractAs the basic method and one of the tools of knowledge organization, the properties of classification organization will make itself more likely become a world-used Information Retrieval Language and the tool used to organize and reveal Network Information Resources in the 21st century.In this paper, the author analyses the advantages of using classification organization method in NIR revelation and the application of document classification, network classification,folksonomy and Ontology in existing organization of network information resources.

Keywords  network information resources    information organization   

document classification    network classification      folksonomy Ontology

1、引言

随着计算机的广泛使用和网络的逐步普及,信息的生产和传输变得空前便捷,由此导致网络信息以惊人的速度增长,“信息爆炸”成为现代社会的一大特征。但是,网络信息总量的增长并不意味着用户获取所需信息数量的增长,正如美国未来学家奈斯比特在《大趋势》一书中所指出的:“我们淹没在信息中,但是却渴求知识”。为什么当各类网络信息像洪水般向我们涌来时,我们仍然缺乏所需要的信息,出现所谓的“信息超载,知识缺乏”情况呢?究其原因,主要就在于网络信息大多分散无序,缺乏科学有效的组织,而在当今的知识经济和信息化社会中,失去控制和无组织的信息已不再是一种资源,相反,它成为信息工作者的敌人。鉴于此,便十分有必要对网络信息资源的有效组织进行研究。

分类组织法作为一种从主题内容角度组织和揭示信息资源的方法,不仅根据信息资源的内容属性进行区分和类聚,同时还将各种门类的资源按照类目之间的关系加以组织,使得信息资源成为一个根据其远近亲疏组织而成的具有等级性、次第性的系统,能够较为全面和客观地反映信息资源的全貌及其内在的逻辑关系。在当前网络信息资源在社会信息资源中的比重日趋上升并逐渐成为国民经济和社会发展的基础性和战略性资源的背景下,研究网络信息资源的分类组织意义更显重大。

2、分类法组织网络信息资源的优势

分类组织法是一种按照事先规定好的学科或体系范畴,依照一定的属性将信息分门别类组织成系统以便于查检的方法。按照学科范畴组织信息具有很好的层次性与系统性,便于使人“即类求书、因书就学”。由于“分类”这种组织文献资源的方法符合人类认识事物的逻辑思维方式,长期以来在揭示文献内容、聚集相同文献、区分不同文献方面有着十分广泛的应用基础。在信息网络环境下,从现有的各种联机数据库、光盘检索系统与网络查询工具的结构与功能看,分类法采用划分范畴的树状结构组织与揭示信息、提供按学科专业或范畴领域检索信息资源的途径,具有很好的稳定性与系统性。它不仅适用于文本信息而且能解决非文本信息、超文本信息等的组织与揭示问题。所以说分类法仍然是组织与揭示网络信息资源的重要方法。

作为最经典、最成熟的信息组织方法,分类法的使用为改善网络信息的访问提供了一种解决办法。与那些没有使用分类法的站点相比,使用了分类法来组织知识的站点具有以下几个优点:(1)主题分类列表可以作为一种导航工具,使得用户尤其是缺乏经验的用户或者对某个主题及其结构、术语不熟悉的用户能够通过浏览查找所需要的信息资源。(2)分类表是等级式的,因而能够用于扩大检索范围以提高查全率,或者用于将检索提问限制到集合中的某个部分,缩小检索范围以提高查准率。(3)分类表的使用为检索用词提供了语境,例如,能够部分克服同形异义词的问题。(4)由于分类系统经常使用独立于特定语言的分类号,它可以作为一种语言转换机制,服务于多语种检索。(5)如果一个网站所使用的是某部比较通用的分类表(如DDC、UDC等),那么它能够比较容易对其它使用了相同分类表的网站实现跨数据库浏览和主题检索。

3、网络信息资源的分类组织方法

目前,关于网络信息资源的分类组织主要采取四种方法:一是基本以人工标引方式采用传统的文献分类法;二是以人工标引或自动标引方式采用自编的分类系统——网络分类法;三是采用新兴的网络信息分类法——分众分类法(Folksonomy)的网络信息资源分类法。

3.1文献分类法

3.1.1文献分类法法在网络信息组织中的应用现状

(1)杜威十进分类法(DDC)。Web上的分类目录采用DDC作为分类体系始于1995年。现已有一些站点以DDC为分类体系,这些站点以图书馆和大学为主。根据OCLC网站上的信息,目前至少已有100多家图书馆使用DDC来组织它们的联机目录。

(2)国际十进分类法(UDC)。UDC由六万多个类目构成,并提供多种复分表,在满足文献资料细分方面有独到优势,它具有分面组配分类法的一些特点,通过符号组配可以获得概念的组合,因此,这种分类法较适合于机检。根据UDCC(UDC Consortium,UDC目前的拥有者和管理机构)站点上的信息,欧洲至少有23个,全世界至少有30个国家将UDC用于其国家书目中。

(3)《中图法》同样可应用于网络信息资源组织。目前,一些数据库(如中国科技成果数据库)、数字图书馆(如超星数字图书馆等)和网上书店(如人民时空)使用了《中图法》来标引和组织文献,中国教育与科研网也使用了《中图法》。中文搜索引擎仅“网络指南针”是利用《中图法》建立起网络目录的,但现在只有两级类目的框架,并没有多少内容。

3.1.2 文献分类法的现代化改造

网络信息资源组织需要分类法,网络信息检索与浏览也需要分类法。现有的研究和实践应用情况都表明传统的文献分类法能够适应网络信息组织与检索。但是网络信息组织与传统概念上的信息组织有是有很大区别的。因此,传统文献分类法要应用于网络信息组织,必须进行现代化改造,具体包括以下几个方面:

(1)机读化和网络化。机读化是传统分类法进入网络的必要前提。

(2)充分利用新技术、新方法改造原有的分类法,提高传统分类法描述网上信息主题的能力。根据网络信息资源的特点对类表进行完善、调整,大量充实入口词,并且解决复合主题的转换问题,包括引用次序的调整,使类目具有较强的规律性。一方面充分利用超文本技术,加强横向联系,加强多重列类的使用;纵向联系则借助层层连接来实现,同时要注意对类目体系深度予以控制。另一方面加强分面分析方法的应用。

(3)修订类名,增强其表达性和通用性。

(4)创制新型网络信息分类法。在电子政务电子商务及各种网络应用系统发展的环境下,传统分类法还不能包罗万象地适应所有的需求,因此,根据实际需要,创制新型的网络信息分类法是十分必要的。

3.2 网络分类法

3.2.1 网络分类法的种类及特点

目前,用于网络信息组织的网络分类法主要有三种:(1)等级式主题分类法系统;(2)分面组配分类法系统;(3)学科分类法系统。网络分类法作为网络环境的产物,是根据网络环境下的特点和需求编制的,有自己的独特之处,具体表现在:(1)重视以事物为中心设置类目;(2)类目收录范围宽泛;(3)多重列类,重复反映;(4)排列方式简便(对同位类的排列,主要有两种方式:一是字顺方式,可以方便用户对特定类目的查找,有利于简化新类的增补。二是检索频率确定同位类的排列次序,在同位类中首先列举高频类,突出热门主题,方便多数用户使用);(5)直接以语词组织信息,比使用分类标记更加方便直观、易于理解,适合普通用户的使用习惯;(6)更新迅速。

3.2.2 网络分类法的不足

网络自编分类体系作为一种新型的体系,虽然在结合网络技术的特点、充分反应用户需要和文献资源的情况等方面作出了许多努力,但由于未能充分汲取已有的分类理论和技术,同时,作为使用系统,面对着处理数量巨大的网络资源的压力,不可避免地存在着不足。

(1)类目设置缺乏规律性。不少系统中同位类的展开是多元的,往往同时采用多个标准,每一个标准使用时又并不完整设类,有时同位类中往往同时包含不同等级、层次的类目,这样就造成某些类目之间关系含糊不清,增加了类目体系的不确定性,使得信息的查找不易掌握。

(2)类目归属存在着不合理现象。表现在两个方面:一是类表在确定类目的下位类时,相关类收入范围过宽,导致收入一些超出母类外延的类目;二是未能按照知识之间的关系,合理确定类目的归属,这显然不利于分类体系的有效使用。

(3)同位类排列不能揭示类间关系,缺乏对知识门类系统显示的能力和揭示类目相关性的作用。特别是在同位类采用多种划分标准的情况下,更容易造成类目关系的混乱。

(4)横向关系的揭示形式单一,只采用重复反映一种形式,不能充分揭示横向关系中多重重复关系与相关关系等的不同类型;此外,在处理过程也缺乏对范围的适度控制。

(5)部分类名不确切。类名有时不能确切概括类目的内涵,有时只有象征意义。此外,由于网络类目的下位类范围较宽,上位类有时很难有效限定其含义,加之网络自编分类体系一般不使用注释揭示类目的内涵,容易使一些类目的含义和范围难以确定,影响使用效果。

(6)分类规则有待完善。网络分类体系的多维性和网络文献的多样性,需要详尽的分类规则。但到目前为止,多数系统仍没有建立起适合网络文献的特点、符合网络分类体系的比较充分的标引规范,从而影响了标引的准确性和一致性,无法充分揭示有价值的网络文献,造成标引质量降低,影响实际检索效果。

3.3 分众分类法

近年来,随着社会性软件的发展,一种新型的网络信息分类法——分众分类法(Folksonomy)应用到了越来越多的网络系统中,它倡导一种与传统分类法截然不同的分类主张,即将分类体系完全交给大众而不是分类权威来完成。Folksonomy是一种未经规范的、通常为私有的分类体系,,每一个人都能利用网络进行信息的上载、加工、组织、标注、分享和重用,分众分类法对于个人来说是一种网络信息组织工具,对整个网站或系统来说,每个人的信息组织方式通过共享,能成为一种很好的“集体智慧”,可用于对用户或者信息进行聚类、内容导航、信息推荐或推送以及数据挖掘等。

3.3.1分众分类法的价值

分众分类法之所以可行,是因为人们似乎随意选取的标签其实具有很高的稳定性,这些标签反映了大众对信息进行组织归类的内在逻辑。事实证明,分众分类法是一个非常有效的分类方法,它利用草根的力量一种人们喜欢的方式将网络上杂乱的信息分类组织在了一起。目前,分众分类法的价值主要表现在以下几个方面:(www.chuimin.cn)

(1)简单性:相对于传统的分类学,分众分类法强调的是简单,不需要特别了解复杂、或是具有层级概念的分类方法,仅依赖一般的知识与直觉,便可寻找或使用相关的内容数据。

(2)社群的建立:由于模仿而对类似内容给予相同的标签,能够创造一种彼此共享的知识并会被某一群人视为使用同一种“语言”在沟通,有助于社群的建立。

(3)相关程度高:由于标签是由那些熟悉内容的使用者所产生的,分众分类法对网络内容的描述将会产生较高的相关性,即使是传统分类学的专家,也不一定能比内容产生者本身做出更精确的描述。

(4)分众分类法给元数据的启示:元数据经过多年的发展,标准越来越复杂,操作和维护成本相当高,而在引用中几乎停滞不前。分众分类法的出现给元数据带来了新的启示:摒弃复杂,简单才是最有生命力的;将权力下放,加以协调引导更有效率;让人们协作编制自己的元数据。

(5)分众分类法有助于发现知识权威:分众分类法可看作由标签、其标引的内容、用户这些结点所组成的网络,因而可以用图论和社会网络的分析方法寻找它们的关联和性质。用户在分众分类法的网络社区里会借鉴其他人的标签而形成标签的稳定性,这种借鉴并不是随意的,每个用户都有在不同领域令他们信任的认知权威,当用户在该领域有问题时,会自然而然地转向权威,从权威那里获得信息,最终形成一个权威链。权威链构成的网络就可以用来测量认知权威的权威度,计算每个人的相对权威。权威是依靠用户自己创造的元数据——标签来传递和表达的。因此,对分众分类法进行分析有助于发现某领域的认知权威,这会对网络秩序和网络建设有更深的理解,也为网络数据挖掘、网络标引、电子商务等提供新的途径。

(6)分众分类法为信息检索提供新的途径:分众分类法的出现就是为了使用户更好的组织和检索信息,虽然最初只是为了方便个人对信息的管理,但是由于大量用户的交互,产生足够的社会效应,具有了相对稳定性,因而分众分类法可以作为信息检索的一个新途径,标签可以成为网络信息检索的操作对象。

3.3.2 分众分类法存在的问题

分众分类法具备明显的优势, 但它的缺陷也是相当明显。其主要缺陷来源于它的主要特点——开放的元数据标签。由于分众分类法是模糊的、非结构化的,所以它也不能够控制相关词和同义词。另外,由于语言本身的模糊性和复杂性,为满足用户思维开放性要求而对分类关键字不加限制, 必然会导致以关键字为核心的标签的模糊性。下面是分众分类法存在的一些问题:

(1)模糊性:基于分众分类法(Folksonomy)的数字资源采用的是根据用户自定义的关键词, 进行描述、分类和检索。由于用户认知程度不同,对同一事物的揭示程度也存在很大的差异;同时由于用词习惯的不同,会出现大量的同义词,这些都会造成查找的困难。

(2)存在一些低使用量的数据:根据分众分类法(Folksonomy)呈现的幂指数曲线,不难发现一部分资源使用的tag 标签,是其他用户很少使用的,因而在查找时,只有极低的发现率。虽然这样能使用户在浏览时,产生意外的发现。但是在检索时,这部分数据就很难被检索到,使用率会相当低。

(3)在整个系统中,一些使用频率特别高的tag标签中会出现一些毫无关系的垃圾资源条目, 它的出现会影响整个数字资源服务系统的运作, 采取什么样的机制来有效地阻止垃圾标签,也是需要考虑的问题。

4、结  语

网络环境下信息资源的分类组织,是一个复杂的庞大的系统工程。目前,网络信息分类组织方法在理论上已经基本形成了体系,但尚未完全应用到实际操作中。我们相信,科学的、合理的网络信息资源分类组织方法的应用将会给网络信息的用户带来很大的实惠,使他们的信息检索与查询工作更加方便、快捷、高效。同时,科学合理的信息组织方法也将促进网络本身的发展,使它越来越被更多的用户所接受,从而扩展网络的应用人群,使网络蓬勃发展。对于网络信息资源分类组织这一问题,还需要各界学者联合起来进行更深入探讨,以使丰富的网络信息资源真正得到更充分、更有效的利用。

参考文献

[1]约翰.奈斯比特著,梅艳译.大趋势——改变我们生活的十个新方向.中国社会科学出版社,1984

[2]Svenonius Elaine.Use of classification in online retrieval.Resources and Technical Services,1983,27(1)

[3]马张华.信息组织(第二版).北京:清华大学出版社,2003.143

[4]Vizine-Goetz Diane.Using library classification schemes for Internet resources.http://www.oclc.org/oclc/man/colloq/v-g.htm#a

[5]Vizine-Goetz Diane.OCLC investigates using classification tools to organizeInternetdata.http://www.oclc.org/oclc/new/n226/research.htm#menu

[6]Koch Traugott et al.The role of classification schemes in Internet resource description and discovery.Work Package 3 of Telematics for ResearchProjectDESIRE(RE1004),1997.http://www.ukoln.ac.uk/metadata/desire/classification/class_tc.htm

[7]刘延章,余义芳.近五年来网络信息分类组织研究的现状及展望.情报学报,2004(2):175~178

[8]谢琳惠.网络信息分类组织研究研究的重点、热点及其他.大学图书馆学报,2006(2):103~106

[9]海野敏.情报资源.国立国会图书馆月报,1994(398):26

[10]黄纯元.图书馆与网络信息资源.中国图书馆学报,1997(6):13~19

[11]郑燕华.网络信息资源及信息检索能力的培养.情报理论与实践,1998(1):55~58

[12]戴维民.信息组织.北京:高等教育出版社,2004.

[13]康存辉.论网络信息资源组织.华中师范大学硕士毕业论文,2004.

[14]赖茂生.信息资源管理教程.北京:清华大学出版社,2006.

[15]康桂英.分类法与主题法在网络信息资源组织与揭示中的应用.图书馆建设,1999(3):26~28

[16]周宁.信息组织(第二版).武汉:武汉大学出版社,2004.

[17]梁桂英,李继旭.Folksonomy初探.图书馆杂志,2006(4):46~49

[18]张淇龙.浅析Folksonomy之意涵与应用.[2008-04-05]. http://www.lac.org.tw/epaper/200614/folksonomy.pdf

[19]王翠英. Folksonomy初探.图书馆学研究,2007(5):85~87

[20] 岳爱华,孙艳妹.Taxonomy、Folksonomy和Ontology的分类理论及相互关系.图书馆杂志,2008(11):21~24

[21]栾芳芳.陈雪强.Web2.0时代的Folksonomy研究.图书情报论坛,2008(2):54~56

[22]秦飞飞.基于大众分类的网络信息资源组织探讨.南通大学学报,2008(4):67~70

作者简介:

何桂芝,女,汉,副研究馆员  现从事河套大学图书馆参考咨询

1999年毕业于内蒙古师范大学中文系汉语言文学专业