教育信息资源建设是教育信息化的基础,是需要长期建设与维护的系统工程。《规范》对教育资源分类方法、属性标注、资源管理系统开发等有直接的指导意义。《规范》定义了教育资源的基本类型,包括九种类型,分别是媒体素材、试卷、试题库、课件、网络课程、案例、文献资料、常见问题解答和资源目录索引。......
2023-11-07
黑体, SimHei; font-size: 22px; color: rgb(255, 0, 0);"> 网络信息资源的分类组织研究
摘 要:作为组织知识集合的基本方式、知识组织的工具之一,分类组织法的特性使其最有可能成为国际通用信息检索语言,成为跨世纪网络信息资源组织与揭示的工具。本文分析了分类法组织揭示网络信息资源的优势以及文献分类法、网络分类法、分众分类法在现有网络信息资源组织中的应用。
关键词:网络信息资源 信息组织 文献分类法 网络分类法 分众分类法 本体论
Abstract:As the basic method and one of the tools of knowledge organization, the properties of classification organization will make itself more likely become a world-used Information Retrieval Language and the tool used to organize and reveal Network Information Resources in the 21st century.In this paper, the author analyses the advantages of using classification organization method in NIR revelation and the application of document classification, network classification,folksonomy and Ontology in existing organization of network information resources.
Keywords: network information resources information organization
document classification network classification folksonomy Ontology
1、引言
随着计算机的广泛使用和网络的逐步普及,信息的生产和传输变得空前便捷,由此导致网络信息以惊人的速度增长,“信息爆炸”成为现代社会的一大特征。但是,网络信息总量的增长并不意味着用户获取所需信息数量的增长,正如美国未来学家奈斯比特在《大趋势》一书中所指出的:“我们淹没在信息中,但是却渴求知识”。为什么当各类网络信息像洪水般向我们涌来时,我们仍然缺乏所需要的信息,出现所谓的“信息超载,知识缺乏”情况呢?究其原因,主要就在于网络信息大多分散无序,缺乏科学有效的组织,而在当今的知识经济和信息化社会中,失去控制和无组织的信息已不再是一种资源,相反,它成为信息工作者的敌人。鉴于此,便十分有必要对网络信息资源的有效组织进行研究。
分类组织法作为一种从主题内容角度组织和揭示信息资源的方法,不仅根据信息资源的内容属性进行区分和类聚,同时还将各种门类的资源按照类目之间的关系加以组织,使得信息资源成为一个根据其远近亲疏组织而成的具有等级性、次第性的系统,能够较为全面和客观地反映信息资源的全貌及其内在的逻辑关系。在当前网络信息资源在社会信息资源中的比重日趋上升并逐渐成为国民经济和社会发展的基础性和战略性资源的背景下,研究网络信息资源的分类组织意义更显重大。
2、分类法组织网络信息资源的优势
分类组织法是一种按照事先规定好的学科或体系范畴,依照一定的属性将信息分门别类组织成系统以便于查检的方法。按照学科范畴组织信息具有很好的层次性与系统性,便于使人“即类求书、因书就学”。由于“分类”这种组织文献资源的方法符合人类认识事物的逻辑思维方式,长期以来在揭示文献内容、聚集相同文献、区分不同文献方面有着十分广泛的应用基础。在信息网络环境下,从现有的各种联机数据库、光盘检索系统与网络查询工具的结构与功能看,分类法采用划分范畴的树状结构组织与揭示信息、提供按学科专业或范畴领域检索信息资源的途径,具有很好的稳定性与系统性。它不仅适用于文本信息而且能解决非文本信息、超文本信息等的组织与揭示问题。所以说分类法仍然是组织与揭示网络信息资源的重要方法。
作为最经典、最成熟的信息组织方法,分类法的使用为改善网络信息的访问提供了一种解决办法。与那些没有使用分类法的站点相比,使用了分类法来组织知识的站点具有以下几个优点:(1)主题分类列表可以作为一种导航工具,使得用户尤其是缺乏经验的用户或者对某个主题及其结构、术语不熟悉的用户能够通过浏览查找所需要的信息资源。(2)分类表是等级式的,因而能够用于扩大检索范围以提高查全率,或者用于将检索提问限制到集合中的某个部分,缩小检索范围以提高查准率。(3)分类表的使用为检索用词提供了语境,例如,能够部分克服同形异义词的问题。(4)由于分类系统经常使用独立于特定语言的分类号,它可以作为一种语言转换机制,服务于多语种检索。(5)如果一个网站所使用的是某部比较通用的分类表(如DDC、UDC等),那么它能够比较容易对其它使用了相同分类表的网站实现跨数据库浏览和主题检索。
3、网络信息资源的分类组织方法
目前,关于网络信息资源的分类组织主要采取四种方法:一是基本以人工标引方式采用传统的文献分类法;二是以人工标引或自动标引方式采用自编的分类系统——网络分类法;三是采用新兴的网络信息分类法——分众分类法(Folksonomy)的网络信息资源分类法。
3.1文献分类法
3.1.1文献分类法法在网络信息组织中的应用现状
(1)杜威十进分类法(DDC)。Web上的分类目录采用DDC作为分类体系始于1995年。现已有一些站点以DDC为分类体系,这些站点以图书馆和大学为主。根据OCLC网站上的信息,目前至少已有100多家图书馆使用DDC来组织它们的联机目录。
(2)国际十进分类法(UDC)。UDC由六万多个类目构成,并提供多种复分表,在满足文献资料细分方面有独到优势,它具有分面组配分类法的一些特点,通过符号组配可以获得概念的组合,因此,这种分类法较适合于机检。根据UDCC(UDC Consortium,UDC目前的拥有者和管理机构)站点上的信息,欧洲至少有23个,全世界至少有30个国家将UDC用于其国家书目中。
(3)《中图法》同样可应用于网络信息资源组织。目前,一些数据库(如中国科技成果数据库)、数字图书馆(如超星数字图书馆等)和网上书店(如人民时空)使用了《中图法》来标引和组织文献,中国教育与科研网也使用了《中图法》。中文搜索引擎仅“网络指南针”是利用《中图法》建立起网络目录的,但现在只有两级类目的框架,并没有多少内容。
3.1.2 文献分类法的现代化改造
网络信息资源组织需要分类法,网络信息检索与浏览也需要分类法。现有的研究和实践应用情况都表明传统的文献分类法能够适应网络信息组织与检索。但是网络信息组织与传统概念上的信息组织有是有很大区别的。因此,传统文献分类法要应用于网络信息组织,必须进行现代化改造,具体包括以下几个方面:
(1)机读化和网络化。机读化是传统分类法进入网络的必要前提。
(2)充分利用新技术、新方法改造原有的分类法,提高传统分类法描述网上信息主题的能力。根据网络信息资源的特点对类表进行完善、调整,大量充实入口词,并且解决复合主题的转换问题,包括引用次序的调整,使类目具有较强的规律性。一方面充分利用超文本技术,加强横向联系,加强多重列类的使用;纵向联系则借助层层连接来实现,同时要注意对类目体系深度予以控制。另一方面加强分面分析方法的应用。
(3)修订类名,增强其表达性和通用性。
(4)创制新型网络信息分类法。在电子政务、电子商务及各种网络应用系统发展的环境下,传统分类法还不能包罗万象地适应所有的需求,因此,根据实际需要,创制新型的网络信息分类法是十分必要的。
3.2 网络分类法
3.2.1 网络分类法的种类及特点
目前,用于网络信息组织的网络分类法主要有三种:(1)等级式主题分类法系统;(2)分面组配分类法系统;(3)学科分类法系统。网络分类法作为网络环境的产物,是根据网络环境下的特点和需求编制的,有自己的独特之处,具体表现在:(1)重视以事物为中心设置类目;(2)类目收录范围宽泛;(3)多重列类,重复反映;(4)排列方式简便(对同位类的排列,主要有两种方式:一是字顺方式,可以方便用户对特定类目的查找,有利于简化新类的增补。二是检索频率确定同位类的排列次序,在同位类中首先列举高频类,突出热门主题,方便多数用户使用);(5)直接以语词组织信息,比使用分类标记更加方便直观、易于理解,适合普通用户的使用习惯;(6)更新迅速。
3.2.2 网络分类法的不足
网络自编分类体系作为一种新型的体系,虽然在结合网络技术的特点、充分反应用户需要和文献资源的情况等方面作出了许多努力,但由于未能充分汲取已有的分类理论和技术,同时,作为使用系统,面对着处理数量巨大的网络资源的压力,不可避免地存在着不足。
(1)类目设置缺乏规律性。不少系统中同位类的展开是多元的,往往同时采用多个标准,每一个标准使用时又并不完整设类,有时同位类中往往同时包含不同等级、层次的类目,这样就造成某些类目之间关系含糊不清,增加了类目体系的不确定性,使得信息的查找不易掌握。
(2)类目归属存在着不合理现象。表现在两个方面:一是类表在确定类目的下位类时,相关类收入范围过宽,导致收入一些超出母类外延的类目;二是未能按照知识之间的关系,合理确定类目的归属,这显然不利于分类体系的有效使用。
(3)同位类排列不能揭示类间关系,缺乏对知识门类系统显示的能力和揭示类目相关性的作用。特别是在同位类采用多种划分标准的情况下,更容易造成类目关系的混乱。
(4)横向关系的揭示形式单一,只采用重复反映一种形式,不能充分揭示横向关系中多重重复关系与相关关系等的不同类型;此外,在处理过程也缺乏对范围的适度控制。
(5)部分类名不确切。类名有时不能确切概括类目的内涵,有时只有象征意义。此外,由于网络类目的下位类范围较宽,上位类有时很难有效限定其含义,加之网络自编分类体系一般不使用注释揭示类目的内涵,容易使一些类目的含义和范围难以确定,影响使用效果。
(6)分类规则有待完善。网络分类体系的多维性和网络文献的多样性,需要详尽的分类规则。但到目前为止,多数系统仍没有建立起适合网络文献的特点、符合网络分类体系的比较充分的标引规范,从而影响了标引的准确性和一致性,无法充分揭示有价值的网络文献,造成标引质量降低,影响实际检索效果。
3.3 分众分类法
近年来,随着社会性软件的发展,一种新型的网络信息分类法——分众分类法(Folksonomy)应用到了越来越多的网络系统中,它倡导一种与传统分类法截然不同的分类主张,即将分类体系完全交给大众而不是分类权威来完成。Folksonomy是一种未经规范的、通常为私有的分类体系,,每一个人都能利用网络进行信息的上载、加工、组织、标注、分享和重用,分众分类法对于个人来说是一种网络信息组织工具,对整个网站或系统来说,每个人的信息组织方式通过共享,能成为一种很好的“集体智慧”,可用于对用户或者信息进行聚类、内容导航、信息推荐或推送以及数据挖掘等。
3.3.1分众分类法的价值
分众分类法之所以可行,是因为人们似乎随意选取的标签其实具有很高的稳定性,这些标签反映了大众对信息进行组织归类的内在逻辑。事实证明,分众分类法是一个非常有效的分类方法,它利用草根的力量一种人们喜欢的方式将网络上杂乱的信息分类组织在了一起。目前,分众分类法的价值主要表现在以下几个方面:(www.chuimin.cn)
(1)简单性:相对于传统的分类学,分众分类法强调的是简单,不需要特别了解复杂、或是具有层级概念的分类方法,仅依赖一般的知识与直觉,便可寻找或使用相关的内容数据。
(2)社群的建立:由于模仿而对类似内容给予相同的标签,能够创造一种彼此共享的知识并会被某一群人视为使用同一种“语言”在沟通,有助于社群的建立。
(3)相关程度高:由于标签是由那些熟悉内容的使用者所产生的,分众分类法对网络内容的描述将会产生较高的相关性,即使是传统分类学的专家,也不一定能比内容产生者本身做出更精确的描述。
(4)分众分类法给元数据的启示:元数据经过多年的发展,标准越来越复杂,操作和维护成本相当高,而在引用中几乎停滞不前。分众分类法的出现给元数据带来了新的启示:摒弃复杂,简单才是最有生命力的;将权力下放,加以协调引导更有效率;让人们协作编制自己的元数据。
(5)分众分类法有助于发现知识权威:分众分类法可看作由标签、其标引的内容、用户这些结点所组成的网络,因而可以用图论和社会网络的分析方法寻找它们的关联和性质。用户在分众分类法的网络社区里会借鉴其他人的标签而形成标签的稳定性,这种借鉴并不是随意的,每个用户都有在不同领域令他们信任的认知权威,当用户在该领域有问题时,会自然而然地转向权威,从权威那里获得信息,最终形成一个权威链。权威链构成的网络就可以用来测量认知权威的权威度,计算每个人的相对权威。权威是依靠用户自己创造的元数据——标签来传递和表达的。因此,对分众分类法进行分析有助于发现某领域的认知权威,这会对网络秩序和网络建设有更深的理解,也为网络数据挖掘、网络标引、电子商务等提供新的途径。
(6)分众分类法为信息检索提供新的途径:分众分类法的出现就是为了使用户更好的组织和检索信息,虽然最初只是为了方便个人对信息的管理,但是由于大量用户的交互,产生足够的社会效应,具有了相对稳定性,因而分众分类法可以作为信息检索的一个新途径,标签可以成为网络信息检索的操作对象。
3.3.2 分众分类法存在的问题
分众分类法具备明显的优势, 但它的缺陷也是相当明显。其主要缺陷来源于它的主要特点——开放的元数据标签。由于分众分类法是模糊的、非结构化的,所以它也不能够控制相关词和同义词。另外,由于语言本身的模糊性和复杂性,为满足用户思维开放性要求而对分类关键字不加限制, 必然会导致以关键字为核心的标签的模糊性。下面是分众分类法存在的一些问题:
(1)模糊性:基于分众分类法(Folksonomy)的数字资源采用的是根据用户自定义的关键词, 进行描述、分类和检索。由于用户认知程度不同,对同一事物的揭示程度也存在很大的差异;同时由于用词习惯的不同,会出现大量的同义词,这些都会造成查找的困难。
(2)存在一些低使用量的数据:根据分众分类法(Folksonomy)呈现的幂指数曲线,不难发现一部分资源使用的tag 标签,是其他用户很少使用的,因而在查找时,只有极低的发现率。虽然这样能使用户在浏览时,产生意外的发现。但是在检索时,这部分数据就很难被检索到,使用率会相当低。
(3)在整个系统中,一些使用频率特别高的tag标签中会出现一些毫无关系的垃圾资源条目, 它的出现会影响整个数字资源服务系统的运作, 采取什么样的机制来有效地阻止垃圾标签,也是需要考虑的问题。
4、结 语
网络环境下信息资源的分类组织,是一个复杂的庞大的系统工程。目前,网络信息分类组织方法在理论上已经基本形成了体系,但尚未完全应用到实际操作中。我们相信,科学的、合理的网络信息资源分类组织方法的应用将会给网络信息的用户带来很大的实惠,使他们的信息检索与查询工作更加方便、快捷、高效。同时,科学合理的信息组织方法也将促进网络本身的发展,使它越来越被更多的用户所接受,从而扩展网络的应用人群,使网络蓬勃发展。对于网络信息资源分类组织这一问题,还需要各界学者联合起来进行更深入探讨,以使丰富的网络信息资源真正得到更充分、更有效的利用。
参考文献:
[1]约翰.奈斯比特著,梅艳译.大趋势——改变我们生活的十个新方向.中国社会科学出版社,1984
[2]Svenonius Elaine.Use of classification in online retrieval.Resources and Technical Services,1983,27(1)
[3]马张华.信息组织(第二版).北京:清华大学出版社,2003.143
[4]Vizine-Goetz Diane.Using library classification schemes for Internet resources.http://www.oclc.org/oclc/man/colloq/v-g.htm#a
[5]Vizine-Goetz Diane.OCLC investigates using classification tools to organizeInternetdata.http://www.oclc.org/oclc/new/n226/research.htm#menu
[6]Koch Traugott et al.The role of classification schemes in Internet resource description and discovery.Work Package 3 of Telematics for ResearchProjectDESIRE(RE1004),1997.http://www.ukoln.ac.uk/metadata/desire/classification/class_tc.htm
[7]刘延章,余义芳.近五年来网络信息分类组织研究的现状及展望.情报学报,2004(2):175~178
[8]谢琳惠.网络信息分类组织研究研究的重点、热点及其他.大学图书馆学报,2006(2):103~106
[9]海野敏.情报资源.国立国会图书馆月报,1994(398):26
[10]黄纯元.图书馆与网络信息资源.中国图书馆学报,1997(6):13~19
[11]郑燕华.网络信息资源及信息检索能力的培养.情报理论与实践,1998(1):55~58
[12]戴维民.信息组织.北京:高等教育出版社,2004.
[13]康存辉.论网络信息资源组织.华中师范大学硕士毕业论文,2004.
[14]赖茂生.信息资源管理教程.北京:清华大学出版社,2006.
[15]康桂英.分类法与主题法在网络信息资源组织与揭示中的应用.图书馆建设,1999(3):26~28
[16]周宁.信息组织(第二版).武汉:武汉大学出版社,2004.
[17]梁桂英,李继旭.Folksonomy初探.图书馆杂志,2006(4):46~49
[18]张淇龙.浅析Folksonomy之意涵与应用.[2008-04-05]. http://www.lac.org.tw/epaper/200614/folksonomy.pdf
[19]王翠英. Folksonomy初探.图书馆学研究,2007(5):85~87
[20] 岳爱华,孙艳妹.Taxonomy、Folksonomy和Ontology的分类理论及相互关系.图书馆杂志,2008(11):21~24
[21]栾芳芳.陈雪强.Web2.0时代的Folksonomy研究.图书情报论坛,2008(2):54~56
[22]秦飞飞.基于大众分类的网络信息资源组织探讨.南通大学学报,2008(4):67~70
作者简介:
何桂芝,女,汉,副研究馆员 现从事河套大学图书馆参考咨询
1999年毕业于内蒙古师范大学中文系汉语言文学专业
有关华北高校图协第25届学术年会论文集的文章
教育信息资源建设是教育信息化的基础,是需要长期建设与维护的系统工程。《规范》对教育资源分类方法、属性标注、资源管理系统开发等有直接的指导意义。《规范》定义了教育资源的基本类型,包括九种类型,分别是媒体素材、试卷、试题库、课件、网络课程、案例、文献资料、常见问题解答和资源目录索引。......
2023-11-07
体育组织分类的标准有很多,本书采用的是按照体育组织的运行机制进行划分,将体育组织分为职业体育组织、国际体育组织、政府体育组织、商业公司组织四大类。(二)国际体育组织在过去,主办奥运会曾被认为是展示国力、提升城市能见度的绝佳方法。......
2023-11-18
按照这个三世界理论,人们将文献信息资源分为零次文献、一次文献、二次文献和三次文献等4种不同的类型。②一次文献一次文献又称原始文献,它反映最原始的信息资源,是人们研究或创造性的活动的直接记录。一次文献在整个文献中,数量最大,种类最多,影响最大,是被检索信息资源的重要组成部分,例如期刊文献、科技报告、学位论文、公开发表的著作等。......
2023-08-16
网络信息资源分析是指根据研究目的和要求,对已收集和整理好的信息资源进行综合、分析、对比、推理,重新组成一个新的有机整体。常用于网络信息资源分析的方法有对比分析法和相关分析法。对比分析法对比分析法是对信息资源进行定性分析的一种方法,可分为纵向对比分析和横向对比分析两种。......
2023-08-16
由表3-15可以看出组织块分为以下几类:程序循环组织块程序循环OB在CPU处于RUN模式时循环执行。OB1是默认循环组织块,其他程序循环OB必须标识为OB200或更大。延时中断组织块通过启动中断指令组态事件后,时间延迟组织块将以指定的时间间隔执行。指定的延迟时间结束时,时间延迟组织块将中断正常的循环程序执行。OB 82是唯一支持诊断错误事件的组织块。......
2023-06-15
据统计,各种各样的Internet网络信息检索工具已有数千个,我们可以按照这些工具的检索机制、检索内容范围、包含检索工具的数量、检索资源类型,将它们划分为以下各类检索工具。根据检索工具的数据检索机制,我们可将检索工具分为检索型、目录型和混合型检索工具。通常意义上的检索工具通过自身的采集标引机制、数据组织机制和数据检索机制提供检索服务,我们可以将它们称为“独立搜索引擎”。元搜索引擎就是在这种情况下应运而生的。......
2023-07-02
行为科学时期具有代表性的组织理论有梅奥、马斯洛以及巴纳德等人的组织理论。行为科学时期组织理论的最主要贡献分别在于:梅奥等人认为,组织不仅是一个技术——经济系统,而且是一个社会系统,对人的激励不仅有经济方面,还有社会方面和心理方面。麦格雷戈将科学管理时期的以指挥、控制为主要特征的组织理论称为“X理论”,并对这种组织理论的特点作了概括。......
2023-11-30
针对东南亚国家网络信息资源的分布特点,主要有以下四种网络信息资源的收集方法。世界上最大的索引型搜索引擎Google针对多个东南亚国家推出了适合本国用户的分站搜索引擎,是检索东南亚各国网络信息资源最实用和有效的索引型网络信息检索工具。在检索东南亚国家网络信息资源时,重点检索与所需信息相关的政府部门或机构网站,往往能获得很多既有用又可靠的信息。......
2023-08-16
相关推荐