集成,就是分布式数据库系统力求达到的目标。分布式数据库系统涉及分布计算和分布式处理问题。从分布式数据库系统的角度看,这些部分都是必要的,也是重要的。分布式数据库系统是一种分布式处理系统,因此有上述好处。分布式数据库和分布式处理这两个词虽然是密切相关的,但也有差别。显然,分布式数据库系统是一种面向数据管理的分布式系统。反之,则称为异构型分布式数据库管理系统。......
2025-09-30
2025年,Enslow在其文章“What is a Distributed Data Processing System”中讨论了透明性(transparency)问题。文中提到分布式数据处理涉及系统透明性的问题,即将系统透明性定义为“permitting services to be requested by name only.The server does not have to be identified”。
透明性其实早就涉及,例如:常用的分层结构就是为了满足透明性;网络的OSI七层结构就是为了将每层的实现细节隐藏起来,上层只清楚下一层的服务,并为下一层提供接口。这样保证了实现的多样性和充分的灵活性。
分布透明性,即数据分布对用户是透明的,而用户在分布式数据系统面前如同处于非分布式系统一样,感觉不到分布。其实,计算机网络和分布式系统的最大差别就是,后者满足分布透明性,而前者恰恰相反。
所以下面先讨论分布式数据库的分层模型(体系结构),即遵循分布透明性的模型,再讨论DDBMS的一般形态。
分布式数据库系统的参考模型如图2.10所示。

图2.10 分布式数据库系统的参考模型
1.全局模式
全局模式(global schema)也称(模型)顶层(top level),因为这是最贴近用户的层面。这也是用户看到的数据库的一个全局模式。在这里定义所有的数据,如同完全没有分布一样。在这个层面上所定义的是全局关系(global relations)。
2.分片模式
每个全局关系可以分解成几个不相交的部分——(数据)片(fragments)。有多种方法可以用来实施这种分解。将从全局关系到分片的映射称为分片模式(fragmentation schema)。数据分片是分布式数据库特有的现象,后面章节会详细讨论。
3.分配模式
数据片是全局关系的逻辑分割,物理上,数据片可以放在网络的一个节点上,也可以放在几个节点上。(https://www.chuimin.cn)
分配模式(allocation schema)可以定义数据片放在哪个(些)节点上。分配模式可以决定分布式数据库是冗余的还是非冗余的。
所谓冗余,是指为1∶n的情况,即一个数据片有多个副本。所谓非冗余,是指为1∶1的情况,即一个数据片只有一个副本。
数据分片是分布式数据库遇到的一个特殊问题。从关系数据模式定义来看,一个关系是全局性的,如跨国公司的雇员信息,但是这些数据又分别存储在该公司遍布全球的分布式数据库里,每个局部数据库里都有本地雇员的信息。这些信息具有相同的数据结构、语义结构,等等。数据分片的主要功能就是解决这类问题。
数据分片可以分成多个类别。典型的数据分片有数据水平分片、数据垂直分片和数据混合分片。数据分片必须遵循一些规则,这些规则可以归纳为以下三条。
●完整性:全局关系的所有数据都必须映射到数据片上。
●可重构性:数据片始终可以重构成全局关系。
●不相交性:数据片应当是不相交的,从而使得在分配层中可以显式控制数据的复制。
完整性是指分片不应丢失数据,即一个关系的所有数据都应有自己的归属,总会落在一个数据片里。可重构性是指数据分片后能重组成原形。不相交性是希望数据片的归属是唯一的。
图2.11是数据分片的示意图。这里,一个关系(如图2.11所示的左部)可以逻辑上分成若干数据片,如图2.11中的中间部分,称为虚关系。物理上,它们会分派到不同的网络节点(如图2.11所示的右部),允许冗余存在,目的是使用方便、高效和保证可靠性。右部我们称之为物理关系。

图2.11 数据分片示意图
下面讨论主要的数据分片形态。
相关文章
集成,就是分布式数据库系统力求达到的目标。分布式数据库系统涉及分布计算和分布式处理问题。从分布式数据库系统的角度看,这些部分都是必要的,也是重要的。分布式数据库系统是一种分布式处理系统,因此有上述好处。分布式数据库和分布式处理这两个词虽然是密切相关的,但也有差别。显然,分布式数据库系统是一种面向数据管理的分布式系统。反之,则称为异构型分布式数据库管理系统。......
2025-09-30
SQL语言是关系数据库的国际标准语言。1992年通过的SQL标准称为SQL2,于1999年再次更新为SQL99或SQL3标准。将SQL嵌入宿主语言,还需要提供对选出的数据进行面向逐个......
2025-09-30
体系结构是计算机科学中常用的概念。什么是体系结构呢?图2.1数据库系统的基本结构由图2.1可知,数据库管理系统构建在操作系统上,用于管理数据库,给用户提供所需的服务。那么,数据库管理系统的体系结构是怎样的呢?图2.22层数据库系统结构图2.33层数据库系统结构3.多层结构对于大型、复杂的应用,3层结构显得力不从心,因此更多的层次出现在系统中。......
2025-09-30
按区域大小,计算机网络主要分为局域网、城域网和广域网等。计算机网络为人们进行信息交流提供了方便、快捷的途径。这一时期的网络一般称为第二代计算机网络,以远程大规模互联为其主要特点。应该说,20世纪70年代至80年代间,第二代计算机网络得到了迅猛发展。这些特点往往被认为是现代计算机网络的一般特征。第二代计算机网络以通信子网为中心。......
2025-09-30
分布式数据库系统的基本功能处于应用层。分布式数据库系统既是一个分布式系统,也是一个数据库系统,因此其体系结构兼顾两者。这三个方面从某种程度上反映了分布式数据库系统的特点。自主性是分布式数据库系统重点强调的一个特性。图2.7分布式数据库的参考体系结构分布式数据库中的数据往往是分片的[2],且是复制的。分布式数据库的参考体系结构如图2.7所示。为了进一步说明分布式数据库管理系统的构成,下面仔细分析DDBMS的基本成分。......
2025-09-30
非透明桥发现这个数据请求发向BAR2地址空间,则接收这个数据请求,并在桥片中暂存这个数据请求。图2-18 通过非透明桥21555进行数据传递非透明桥21555除了可以支持存储器到存储器之间的数据传递,还支持PCI总线域到存储器域,以及PCI总线域之间的数据传递,此外非透明桥21555还可以通过I2O和Doorbell寄存器进行Primary PCI总线与Secondary PCI总线之间的中断信号传递。非透明桥有效解决了使用PCI总线连接两个处理器存在的问题,因而得到了广泛的应用。......
2025-09-30
分布式发电系统在近年来得到了飞速发展。由于分布式电源的高效、可靠,可满足工商业、居住和交通应用的一系列要求。而在分布式发电技术中应用最为广泛、前景最为明朗的,应该首推热电冷联产技术。分布式发电所涉及的关键技术主要有分布式电源、电能和能量的交换与管理控制、分布式发电系统结构,以及与大电网进行联网运行的并网控制技术等。与其他分布式电源之间可通过双向功率变换器进行能量的储存和释放。......
2025-09-29
为了有效解决这个问题,IP 协议采取了分片和重装配的机制。重装配为了能够减少中途路由器的工作,降低出错率,重装配的工作是到目的主机才进行的。也就是说,分片后遇到MTU 更大的网络时,并不重装配,而是保持小分组,直到主机接收完整后再进行重装配。IP 协议使用4 个字段来处理分片和重装配问题:第一个字段是报文ID 字段,它唯一标识了某个站某个协议层发出的数据。......
2025-09-30
相关推荐