查询优化的本地化分层聚焦于将查询转换成本地数据。一个全局关系可以通过应用重构规则来重构,从而导出一个关系代数程序,其操作数是数据片,这个程序称为本地化程序。将分布查询分配到节点上的自然办法是生成查询,让每个全局关系使用本地化程序来代替。这可以看成是在一棵分布查询的算符树上将叶子用与本地化程序对应的子树来替代。数据水平分片关系的连接也可以简化。......
2023-10-28
大部分企业建立和维护单一中央数据仓库环境。为什么单一中央数据仓库环境比较流行呢?原因有以下几个
图24.15 ODS+DDS数据流体系结构
图24.16 在多个数据仓库上构建的数据仓库
●数据仓库中的数据是全企业集成的数据,仅在总部使用集成视图。
●数据仓库中的大量数据会让数据的单一集中式存储具有意义。
●即使数据能被集成,但若将它们分布于多个局部站点,那么存取这些数据也很麻烦。
总之,经济和技术等诸多因素都更倾向于建立和维护单一中央数据仓库环境。但是在某些特定场合,需要建立分布式数据仓库环境。
如前所述,企业数据库往往会设计成一个分布式数据库。(www.chuimin.cn)
在一些企业运作中,局部站点是自主的,仅偶然或某些特定的处理需要将数据和业务活动发送到总部处理。对于这类企业来说,采用某种形式的分布式数据仓库是必要的,如图24.17所示。
1.局部数据仓库
数据仓库的一种形式是局部数据仓库。局部数据仓库仅包含对局部层有意义的数据。
数据仓库除存储的数据具有局部功能外,还具有其他任何数据仓库的相同功能。换句话说,局部数据仓库包含的是在局部站点上历史的和集成的数据。局部数据仓库间的数据或数据结构不必协调一致。
2.全局数据仓库
图24.17 分布式数据仓库
全局数据仓库的范围涉及整个企业或组织。它内部的每个局部数据仓库也都有各自服务的局部站点范围,全局数据仓库的范围是该企业。同局部数据仓库一样,全局数据仓库也包含历史数据。
当某企业内一个站点和另外一个站点间的数据有重叠时是合理的。如果企业内存在这样重叠的数据,那么最好将这些数据存放在全局数据仓库中。
有关分布式数据库技术的文章
查询优化的本地化分层聚焦于将查询转换成本地数据。一个全局关系可以通过应用重构规则来重构,从而导出一个关系代数程序,其操作数是数据片,这个程序称为本地化程序。将分布查询分配到节点上的自然办法是生成查询,让每个全局关系使用本地化程序来代替。这可以看成是在一棵分布查询的算符树上将叶子用与本地化程序对应的子树来替代。数据水平分片关系的连接也可以简化。......
2023-10-28
为了说明综合数据库,有必要讨论什么是数据仓库及其特点。多维性是数据库仓库的一个重要特征。数据仓库的关键是数据的存储和管理。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。相对于操作型数据库来说,数据仓库数据库的突出特点是对海量数据的支持和快速的检索技术。......
2023-10-28
ETL系统由一个控制系统依据到达顺序和存放在元数据库的规则及逻辑进行管理。图24.10三维方体图24.11最简单的数据仓库系统谈到数据仓库,往往会涉及一个词,即商务智能。图24.12Stage、ODS和DDS及数据流体系结构样例图24.12中的箭头表示的就是数据流,描述了数据流动过程。......
2023-10-28
与Napster一样,Gnutella也是一个音乐共享系统,但其实现方式有所不同。Gnutella是一个纯无中心P2P系统,主要功能是文件共享。Gnutella系统具有如下特点。一方面,每个查询会广播到尽可能多的节点,Gnutella有能力得到所有潜在结果。......
2023-10-28
关于如何利用中间件集成多数据库,下面举一个使用CORBA集成的例子。参考文献[1]中提出的基于CORBA的多数据库系统体系结构,称为CBMA。CBMA是典型的多数据库系统体系结构,加入CBMA的数据库仍具有自治性,其上原来的应用程序仍能继续运行。MOTM由CORBA的ORB、多数据库系统事务管理器、负载平衡和安全管理等功能模块组成,其中多数据库系统事务管理器、负载平衡和安全管理都是作为ORB的软构件实现的。......
2023-10-28
而数据仓库中的数据仅是一系列某一时刻生成的复杂的快照。图24.8数据仓库的基本结构由图24.8可以看出,数据仓库不仅关注当前数据,也关注历史数据。数据仓库是一次一步地设计和载入数据。在数据仓库中,要在数据量大小与查询的详细程度之间作出权衡。判断样本所带来的问题是使样本数据具有某种偏差,随机抽取数据带来的问题是可能无法进行统计。如上所述,在数据仓库环境中,需要对数据进行分割。......
2023-10-28
可以把RMI看成是远程过程调用的Java版本,RMI能够按照请求传递对象。RMI按以下三个层次实现。CORBA与Java/RMI的主要区别在于以下两个方面。Java起因于一个研究计划,目的是开发适合各种网络设备和嵌入式系统的先进软件。......
2023-10-28
Oracle公司的OPS环境比一般的(单实例)Oracle环境复杂得多。不同结构下的OPS的实施略有不同。图14.23OPS体系结构为了利用这些特性,需要专业人员合适的设计以及恰当的手工配置。下面对有些关键问题进行简单讨论,讨论中会涉及一些Oracle系统专用的术语,读者可参阅Oracle公司的相关文档。DLM与Oracle进程一起工作并相互通信。DLM相关的初始化参数在每个实例的SGA[12]中分配必要的结构以处理消息机制、封锁与实例相关的Cache管理,这样就为各种Oracle进程操纵提供了基础。......
2023-10-28
相关推荐