首页 理论教育基于XML的分布式数据库技术

基于XML的分布式数据库技术

【摘要】:从用户观点看,Web上集成多数据库系统是用户能够从异构数据库中有效地检索更有用的数据,也让数据库管理员和相关组织能更有效地管理它们的数据。XML维护了SGML验证、结构和扩展的特征。在这个方法里,异构数据库模式都借助于XML显式描述,并给出转换规则。XML处理器从系统服务器存放的XML结果文件里检索数据。

为了从Web存取和管理数据库,第一个任务是将数据库和Web连接起来。可使用的技术很多,典型的有CGI(common gateway interface,公共网关接口)、RMI和CORBA等,还有Servlet和Perl DBI(database interface for perl)等,它们都能同时并发连接多个数据库,这就为多数据库的构建奠定了基础。

从用户观点看,Web上集成多数据库系统是用户能够从异构数据库中有效地检索更有用的数据,也让数据库管理员和相关组织能更有效地管理它们的数据。

与HTML一样,XML也是源于SGML(standard generalized markup language),是一种定义和使用文档格式的标准系统。XML维护了SGML验证、结构和扩展的特征。

在这个方法里,异构数据库模式都借助于XML显式描述,并给出转换规则。

参考文献[2]提出的体系架构里,有一个系统服务器,它的工作如下。

●用户如果使用这个系统服务器,则该服务器的登录检查器(login checker)会检查其用户名/口令是否有效,保证合法用户才能访问异构数据库集。(www.chuimin.cn)

●用户提交查询时,先提供一些关键词,再由客户端(浏览器)传递给服务器。查询阅读器模块从HTML中抽取相关关键词传递给子查询生成器。这个模块会按照关键词生成对应于每个数据库的子查询,其形态按照数据库的差异而不同,以适应于本地数据库系统的异构性。

●每个子查询发送给每个本地数据库系统的查询处理器,并在那里被执行。

●每个本地数据库由对应查询处理器返回的结果交付给系统服务器。在那里,异构格式的数据经过转换后集成到XML文件。结果文件放在该服务器。

●如果用户希望检索当前结果的一个子集,则查询阅读器将查询发送给XML处理器。XML处理器从系统服务器存放的XML结果文件里检索数据。用户可以多次使用混存在系统服务器上的查询结果,这样性能和效率会提高。

●上面检索到的结果在必要时会转换成HTML形式并返回到客户端(浏览器),浏览器解释后展示给用户。