首页 理论教育分布式数据库技术:实现数据仓库分布式化

分布式数据库技术:实现数据仓库分布式化

【摘要】:大部分企业建立和维护单一中央数据仓库环境。原因有以下几个图24.15ODS+DDS数据流体系结构图24.16在多个数据仓库上构建的数据仓库●数据仓库中的数据是全企业集成的数据,仅在总部使用集成视图。如前所述,企业数据库往往会设计成一个分布式数据库。局部数据仓库间的数据或数据结构不必协调一致。

大部分企业建立和维护单一中央数据仓库环境。为什么单一中央数据仓库环境比较流行呢?原因有以下几个

图24.15 ODS+DDS数据流体系结构

图24.16 在多个数据仓库上构建的数据仓库

●数据仓库中的数据是全企业集成的数据,仅在总部使用集成视图。

●数据仓库中的大量数据会让数据的单一集中式存储具有意义。

●即使数据能被集成,但若将它们分布于多个局部站点,那么存取这些数据也很麻烦。

总之,经济和技术等诸多因素都更倾向于建立和维护单一中央数据仓库环境。但是在某些特定场合,需要建立分布式数据仓库环境。

如前所述,企业数据库往往会设计成一个分布式数据库。(www.chuimin.cn)

在一些企业运作中,局部站点是自主的,仅偶然或某些特定的处理需要将数据和业务活动发送到总部处理。对于这类企业来说,采用某种形式的分布式数据仓库是必要的,如图24.17所示。

1.局部数据仓库

数据仓库的一种形式是局部数据仓库。局部数据仓库仅包含对局部层有意义的数据。

数据仓库除存储的数据具有局部功能外,还具有其他任何数据仓库的相同功能。换句话说,局部数据仓库包含的是在局部站点上历史的和集成的数据。局部数据仓库间的数据或数据结构不必协调一致。

2.全局数据仓库

图24.17 分布式数据仓库

全局数据仓库的范围涉及整个企业或组织。它内部的每个局部数据仓库也都有各自服务的局部站点范围,全局数据仓库的范围是该企业。同局部数据仓库一样,全局数据仓库也包含历史数据。

当某企业内一个站点和另外一个站点间的数据有重叠时是合理的。如果企业内存在这样重叠的数据,那么最好将这些数据存放在全局数据仓库中。