首页 理论教育数字化学习资源整合:助推教育信息化改革

数字化学习资源整合:助推教育信息化改革

【摘要】:(一)数字化学习资源整合的主要方法1.基于OPAC系统的整合OPAC即联机公共检索目录,是一种通过因特网对馆藏资源进行检索的工具,也是读者查找图书馆资源的主要途径。导航整合通常只能提供数字资源的浅层次服务,不能提供其表达主旨上的服务。因而导航形式的资源整合是数字资源整合的过渡期。(二)数字化学习资源整合的技术1.分类技术智能自动分类。

(一)数字化学习资源整合的主要方法

1.基于OPAC系统的整合

OPAC(Online Public Access Catalogue)即联机公共检索目录,是一种通过因特网对馆藏资源进行检索的工具,也是读者查找图书馆资源的主要途径。它不仅整合传统书目信息,而且将传统书目信息与电子全文期刊、电子全文图书及视听资料建立链接,将书刊与其评论信息、来源信息建立链接,从而形成以纸质资源为核心,向全文、目次、文摘、书评、音频、视频等多媒体信息资源扩展的更全面的资源体系。

2.基于资源导航的整合

基于资源导航的整合是比较成熟的一种整合方式,它实现了不同来源的数字资源按照学科、主题、资源类型等进行组合,为用户提供导航。根据整合的资源类型多少,可以分为整体导航和部分导航。整体导航是通过整体的资源,将所有的资源当作对象,为用户导航;部分导航只是对其中的一种或者一部分导航。导航整合通常只能提供数字资源的浅层次服务,不能提供其表达主旨上的服务。因而导航形式的资源整合是数字资源整合的过渡期。

3.基于跨库检索系统的整合

基于跨库检索系统的整合是导航整合的进阶,它是检索界面的整合,在求知人查询后表现为共享众多资源的整合,即实现对分布式资源的“一站式”访问。基于跨库检索系统的整合模式实现的是在多个数据库内的统一检索,为不同资源访问提供统一的检索入口,但这种整合系统受到不同数据库系统搜索引擎的限制,不易实现。在跨库整合检索中,分布式检索系统是比较理想的模式,但实现起来需要较大范围的协作、需要遵循必要的元数据标准及互操作协议,因而存在一定的困难。

4.基于链接的整合

基于链接的整合是将图书馆所有的资源通过参考引文知识连在一起,形成一个具有内在联系的有机系统,主要提供基于内容层面的知识服务。换句话说,就是利用网络超文本链接特性,将所有资源串在一起,使其形成一个有联系的网络,这样用户就能更快捷地找到自己所需要的数字资源。

5.基于知识管理的整合

知识管理包括启发、包装、管理及知识在各种形式下的重用,“是一种基于知识本体和语义的信息集成,基于本体的知识网格为用户提供基于语义的服务,大大提高了信息加工和服务的知识含量,为知识创新提供了坚实的基础”。知识管理的服务系统为输入、输出参数和类型定义了良好的接口,涉及服务和客户。服务提供者并不将他们的服务向所有人开放,因此由一个中央服务器提供语义服务门户,允许服务提供者制定自己的访问政策。它还提供一种简单的、语义驱动的方法调用服务,不论接口来自任何一个访问点位。

(二)数字化学习资源整合的技术

1.分类技术

(1)智能自动分类。智能自动分类技术有三个突出特点。一是立体性,对文本内容可以从不同方位进行考察,从而找出侧重点不同的信息。二是动态性,指分类法可以灵活地随信息内容概率的分布而进行改变,努力做到分类法的树型结构达到平衡,能更加高效地体现快捷性能。三是面向用户性,指分类系统的实时调节能力,即“自动分类系统本身的识别用途,能够根据用户的需要,在用户指导下对分类体系做出各种人性化的调整,以满足用户的需求。”[3]

(2)分众分类。分众分类即自由分类法,是Web 2.0的重要特征。它依据人们生活中常用词汇对信息进行标记,其结果表现为系列的标签总图,给人一目了然的感觉,在组织和共享信息方面的便捷性都得到了很大的提升,在数据库浏览、热点聚类、个人信息组织方面可以提供更加切实有效的方法。就信息组织而言,因为自由分类法取消了严格的词汇控制和等级结构,所以存在模糊、检索不够全面等缺点。

2.知识管理技术

(1)本体和语义。本体本来是一个哲学性的概念,是研究实体存在及其本质的通用理论,后被引入人工智能领域。它定义基本词汇以及他们之间的关系,组成主题领域的词汇表以及将它们结合在一起成为包括对象、属性和关联的规则体系。其中,“对象代表概念或知识领域中的实体;属性揭示反映对象的特性或值,或者是对对象的某种限定;关联则代表实体对象之间存在的关系、联系,包括概念定义、等同/同义关系、层次关系、相关关系等。这些关联将本体有机地连接成为一个具有语义的整体。”[4]本体论在Web上的应用直接导致了语义Web的诞生,试图解决Web信息共享中的语义问题。

语义是指“数据(符号)”所指代的概念的含义,以及这些含义之间的关系。语义通过人类赋予与计算模型两种途径产生。根据实体资源(如文本和图像)来产生语义是一个很有难度的任务。基于统计的聚类分析、共词分析、信息抽取和挖掘技术可以帮助实现语义的自动抽取。语义网是按照机器可理解的词汇链接起来的网页信息的全球数据库,它能使网络链接资源并且提供人性化的对话服务。语义Web的目标是使得Web上的信息具有计算机可以理解的语义。

(2)叙词与叙词表。叙词(描述词或叙述词)是主题词的一种,是一些以概念为基础的、经过规范化的、具有组配性能、能显示词间语义关系和动态性的词或词组,是描述文献主题的一种标识符。

叙词表是使用最为普遍、发展最为充分、最具有典型性的主题标引工具。作为一个规范化的词汇集合,它以概念为基础,在对词汇进行严格控制的基础上,形成表达概念间等同、等级、相互关系的词汇集。

(3)分词技术。网络信息极为丰富,但也存在着大量芜杂信息,信息过滤不可避免,实现信息过滤需要进行文本处理,文本处理就要利用分词技术。英语、法语等欧美语言在书写时以词作为基本构成单位;而汉语在书写时以一大串汉字的字符串作为基本构成单位,这就导致从形式上无法表达其中概念。因此,中文信息处理的特有问题就是如何将汉语的字符串分割为合理的词语序列,切分成一个一个单独的具有实际意义的词,即中文分词。

3.互操作技术

网络教育资源及其所处环境之间存在许多异种异构的特性,如软硬件系统的冲突、媒体格式的异同等。对此,要找到一种更加完美有效的方法来解决上述的问题,而互操作技术恰好能够切实有效地解决掉这些问题。互操作出现在系统层、文法层、结构层及语义层四个不同层面上,每一层面都有其各自的问题:系统层有硬件和平台操作系统不兼容的问题,文法层有不同语言和数据表达问题,结构层有不同数据模式问题,语义层有信息交换中术语的意义差别问题。“目前,已有许多能够实现上述不同层面互操作的技术存在,比如有中间件、XML、知识本体、资源标准等。”[5]