首页 百科知识工程学科:本体概念与论述

工程学科:本体概念与论述

【摘要】:表2.6本体概念与界说资料来源:本研究汇集整理。事实上,本体就是通过对概念、术语及其相互关系的规范化描述,给出某一领域的基本知识体系和描述语言。

2.3.1 本体概念与本体论

“本体”或“本体论”(ontology)原是哲学中的术语,它与认识论(epistemology)和方法论(methodology)同为哲学的三大基本概念和主题。在哲学上,本体论研究客观事物存在的本质(nature of existence),包括研究什么是事物(things)?什么是本质(essence)?事物发生改变时本质是否仍然存在于事物之中?概念(concept)是否存在于人的心智(mind)之外?怎样对世界上的实体(entities)进行分类等问题。它的主要任务是研究世界上的各种事物(例如物理客体、事件等)以及代表这些事物的范畴(例如概念、特征等)的形式特性和分类。

1613年,德国哲学家郭克兰纽(R.Goclenius)在他用拉丁文编写的《哲学辞典》中,把希腊语的on(也就是being)的复数onta(也就是beings)与logos(含义为学问)结合在一起,创造出ontologia这个术语。ontologia也就是英文的ontology,这是西方文献中最早出现的ontology这个术语。1636年,德国哲学家卡洛维(A.Calovius)在《神的形而上学》中,把ontologia看成“形而上学”(metaphysica,英文为metaphysics)的同义词,于是便把“ontologia”与亚里士多德的“形而上学”紧密地联系起来了。法国哲学家笛卡尔(R.Descartes)更是明确地把研究本体的第一哲学叫做“形而上学的ontologia”,这样,ontologia便成为形而上学的一个部分了。德国哲学家莱布尼兹(G.von Leibniz)和他的继承者沃尔夫(C.Wolff)更是从学科分类的角度,把ontologia归属为形而上学的一个分支,使ontologia成为哲学中一个相对独立的分支学科。ontology这个术语,在哲学中翻译为“本体论”,在自然语言处理中,从应用的角度出发译为“本体”或“知识本体”更为恰当(见冯志伟,2006)。

德国哲学家康德(Emmanuel Kant)也研究知识本体。他认为,事物的本质不仅仅由事物本身决定,也受到人们对于事物的感知或理解的影响。康德提出这样的问题:“我们的心智究竟是采用什么样的结构来捕捉外在世界的呢?”为了回答这个问题,康德对范畴进行了分类,建立了康德的范畴框架,这个范畴框架包括四个大范畴,即:quantity(数量),quality(质量),relation(关系),modality(模态)。每一个大范畴又分为三个小范畴:数量分为unity(单量)、plurality(多量)和totality(总量);质量分为reality(实在质),negation(否定质)和liMITation(限度质);关系分为inherence(继承关系)、causation(因果关系)和community(交互关系);模态分为possibility(可能性)、existence(现实性)和necessity(必要性)。根据这个范畴框架,就可以给事物进行分类,从而获得对于外部世界的认识。康德对于范畴框架的研究,为知识本体的研究奠定了坚实的基础。

在上世纪末和本世纪初,知识本体的研究开始成为计算机科学与工程的一个重要领域。信息技术、知识工程及人工智能科学家和工程师对ontology表现出浓厚兴趣,对其研究和应用远远超出了哲学的范畴。1991年,美国计算机专家R.Niches等人在从事美国国防部高级研究计划局(Defense Advanced Research Projects Agency,DARPA)的一个关于知识共享的研究项目中,提出了一种构建智能系统方法的新思想。他们认为,智能系统应由两部分组成,一个部分是“知识本体”(ontology),另一个部分是“问题求解方法”(problem solving methods,简记为PSM s)。知识本体涉及特定知识领域共有的知识和知识结构,它是静态的知识;PSMs涉及在相应知识领域进行推理的知识,它是动态的知识。PSMs使用知识本体中的静态知识进行动态的推理,就可以构建一个智能系统。

1998年6月,第一届“信息系统中的形式化本体论国际会议”的召开,标志着ontology研究开始走向成熟。在知识工程领域,一般认为本体是engineering artifact(“工程人造物”或“工程制品”),并且派生出构建这种人工物的ontology engineering(本体工程)新学科。但对“本体究竟是什么”,仍是争论中的话题。知识本体有很多不同的定义,以往的定义多从哲学思辨出发或从知识的分类出发,最近的一些定义则是从与计算机相关的科学与工程出发。表2.6中,我们按时间顺序给出这些领域若干研究者对本体所作的阐述或定义。

表2.6 本体(ontology)概念与界说

资料来源:本研究汇集整理。

由以上不同作者的定义可以看出,本体概念的意蕴与哲学的原始意义几近脱离,它涉及一些新的概念:术语(词汇)、术语关系、规则、概念化、本体理论、形式化的规范说明、领域知识、表达和共享、内容理论等。其中重要的基本概念是“概念化”(或译“概念体系”、“概念模型”)(conceptualization),指的是某一概念系统所蕴涵的语义结构,是对某一事实结构的一组非正式的约束规则(Guarino&Giaretta,1995),它也可以理解为和(或)表达为一组概念(如实体、属性、过程)及其定义和相互关系(Uschold&Gruninger,1996)。事实上,本体就是通过对概念、术语及其相互关系的规范化描述,给出某一领域的基本知识体系和描述语言。

在前人工作的基础上,Soergel(2001)对本体内涵作了如下较为完整的概括:(www.chuimin.cn)

(1)在哲学界,本体是一个具体的阐明确定的世界景象或论题的范畴系统;

(2)在人工智能界,本体是由用来描述部分事实的专门词表加上一套关于词汇本意的明确假设而构成的一种工程制品;

(3)在本体工程界,本体是建立一个形式化的、合乎逻辑的理论,通常包括概念、关系、属性、赋值、约束、规则和实例。

研究和构造本体的目的,是为了实现某种程度的知识共享(share)和知识复用(re-usability)。Chandrasekaran等人(1999)认为本体的作用主要有两方面:(1)本体的分析澄清了领域知识的结构,从而为知识表示打好基础。本体应当可以复用,从而避免重复的领域知识分析;(2)统一的术语和概念使知识共享成为可能。Uschold和Gruninger(1996)更具体地把本体的作用概括为:

(1)通讯(communication),主要为人与人之间或组织与组织之间的通讯提供共同的词汇;

(2)互操作(inter-operability),在不同的建模方法、范式、语言和软件工具之间进行翻译和映射,以实现不同系统之间的互操作和集成;

(3)系统工程(systems engineering),主要指通过本体分析为系统实现复用、知识获取、可靠性和规范描述等项功能。

由此可见,本体的最大贡献在于:它可以将某个或多个特定领域的概念和术语规范化,为其在该领域或领域之间的实际应用提供便利。本体的这些功用是基于本体的如下特征(王昕,2002):(1)对知识管理系统来说,本体就是一个正式的词汇表。本体可以将对象知识的概念和相互间的关系进行较为精确的定义,进而使得知识搜索、知识积累、知识共享的效率大大提高,实现真正意义上的知识复用和知识共享;(2)从功能上讲,本体和数据库有些相似,但本体比数据库表达的知识丰富得多。它不仅是一个存放数据的结构,而且能够提供比数据库丰富得多的信息;(3)本体是各种领域内的实体、属性、过程及其相互关系形式化描述的基础,这种形式化的描述可成为知识基系统中可复用和共享的组件;(4)本体可以为知识库的构建提供一个基本的结构,不仅能够描述事物或概念的各个组成部分之间的静态联系,还可以描述事物或概念的运动和变化,使得知识库可以表达现实世界中浩如烟海的知识。这些正是本体在今天得到人们青睐的理由。