首页 理论教育分布式数据库技术:语义Web的应用

分布式数据库技术:语义Web的应用

【摘要】:“Semantic Web”这个词出自万维网的发明者Tim Berners-Lee爵士2001年的文章中:The Semantic Web is an extension of the current Web in which information is given well-defined meaning,better enabling computers and people to work in cooperation.W3C的专门小组将标准化语义Web的概念定义为:The Semantic Web provides a common framework that allows data to be shared and reused across application,enterprise,and community boundaries.可以说,语义Web是一组技术和标准,能让机器理解Web上信息的意义(语义)。图5.10语义Web栈在这个栈的底部定义了标识符URI和字符集Unicode。RDF是一种描述Web资源的简单而又强大的数据模型和语言。语义Web的骨干是本体。

“Semantic Web”(语义Web)这个词出自万维网的发明者Tim Berners-Lee爵士2001年的文章中:

The Semantic Web is an extension of the current Web in which information is given well-defined meaning,better enabling computers and people to work in cooperation.

W3C的专门小组将标准化语义Web的概念定义为:

The Semantic Web provides a common framework that allows data to be shared and reused across application,enterprise,and community boundaries.

可以说,语义Web是一组技术和标准,能让机器理解Web上信息的意义(语义)。这样一组技术和标准可以用一个栈(stack)来描述,如图5.10所示。

图5.10 语义Web栈

在这个栈的底部定义了标识符URI和字符集Unicode。URI[23]是识别信息源的唯一性标识,Unicode是信息源使用的字符集。Unicode[24]是一个ISO标准,定义了国际性的字符集。在它们的上面,XML定义为数据交换语法标准语言。对于数据的描述,W3C规定使用RDF(resource description framework)。RDF是一种描述Web资源的简单而又强大的数据模型和语言。RDF引入了三个基本概念:资源(resources)、属性(properties)和陈述(statements)。资源是我们希望用陈述表述的实体,可以是URI表示的任意东西。属性定义的是主题资源(subject resources)和对象资源(object resources)间的关系。所以,Web资源的陈述是一个三元组〈subject,predicate,object〉。使用RDF模型,三元组可以组合成一个图结构。

RDF定义了一组复杂的数据结构、容器(containers)和集合(collections)。其中容器分为以下三类。(www.chuimin.cn)

(1)封装:〈rdf:Bag〉元素用来包装一群没有顺序的资源。封装通常用在一个属性(property)有多个值中,而这几个值的先后顺序并不重要,例如通信录可能包含许多姓名。封装所包含的值在0个以上,也就是可以不包含值,也可以包含多个重复的值。

(2)顺序:〈rdf:Seq〉元素用来包装一群有顺序的资源。顺序通常用在一个属性(property)有多个值中,而这些值的先后顺序很重要,例如一本书的作者在一个以上,那么有必要区分出主要作者、次要作者。顺序所包含的值在0个以上,也就是可以不包含值,也可以包含多个重复的值。

(3)选择:通常用在一个属性(property)有多个值中,例如某个软件可能提供许多个下载网址。选择所包含的值在1个以上,而第1个值是预设值。

RDF集合是一个封闭资源或文字集。不同于容器,RDF集合里可以包含重复成分。

实体间的分类体系是一个基本关系,而RDF缺乏这方面的支持,因此诞生了RDFS。RDFS(RDF schema)是RDF的扩展,引入了一些手段来描述类(classes)、属性、类分层(hierarchy of classes)和属性。RDFS提供了rdfs:Class、rdfs:subClassOf、rdfs:subProperty Of、rdfs:domain和rdfs:range语言结构,用于创建实体(类)的分类体系。

SPARQL是一个事实标准,是一种协议,也是一种RDF查询语言,用于查询RDF数据。SPARQL是一种图模式匹配语言,定义了一组图模式(graph patterns),最简单的是三元组模式。

语义Web的骨干是本体。本体是共享概念的形式化显式描述。OWL表示Web本体语言(Web ontology language),是在Web上表示知识的标准语言。