首页 理论教育分布式数据库技术及并行DBMS

分布式数据库技术及并行DBMS

【摘要】:实现并行数据库系统依赖于分布式数据库技术。图14.9Teradata DBC并行数据库系统的硬件体系结构图14.9中的DSU是disk storage unit的首字母缩写,负责存储数据。其中,IFP处理来自本地连接终端的请求,COP处理来自网络的请求,因此称为通信处理器。图14.10Teradata DBC示意图图14.11Teradata IFP示意图由图14.12可知,通信处理器COP的主要组成模块是网络接口、负载均衡、会话控制、输入数据转换、SQL解析器、调度器和Ynet接口等。图14.12Teradata COP示意图图14.13Teradata AMP示意图

实现并行数据库系统依赖于分布式数据库技术。本质上,事务管理解决方案可以在这里重用。新的问题是数据定位、查询并行化、并行数据处理和并行查询处理等。它们的新特点是现在的节点数更多了。

与前面所说的分布式数据库系统不同的是,并行数据库系统中的众多处理器扮演着不同角色。因此存在着处理器分工的问题。

一个并行计算机有多个处理器,对于数据库系统来说,如何分配这些处理器也是面临的问题。在处理器无特殊优先分类时,它们的分配就取决于用户的应用和系统存储的特点。

我们先讨论Teradata DBC。在Teradata系统里,可以按照应用的特点,一部分处理器负责响应和处理用户请求,另一部分负责数据管理和存取。

在Teradata DBC中,可以把处理器的任务分为接口处理器(interface processor,IFP)、通信处理器(communication processor,COP)、存取模块处理器(access module processor,AMP)等三类。其中IFP负责处理用户的请求,COP负责处理网络通信,AMP则专门负责数据管理和存取。

图14.9是Teradata DBC并行数据库系统的硬件体系结构。

图14.9 Teradata DBC并行数据库系统的硬件体系结构

图14.9中的DSU是disk storage unit的首字母缩写,负责存储数据。

由图14.9可知,系统的前端是IFP/COP,负责处理用户的请求。其中,IFP处理来自本地连接终端的请求,COP处理来自网络的请求,因此称为通信处理器。这样,并行计算机的处理器的一部分就扮演了IFP和COP的角色。这里的处理器分为两大类,细分为三类,即IFP/COP和AMP。Ynet是将这些处理器互连的基本部件。每个AMP处理器管理独自的磁盘存储单元(DSU)。数据表的存放是跨越所有AMP的,换言之,每个数据表将自己的记录分布到每个AMP上。

下面还是以Teradata DBC为例进行讨论,如图14.10所示。但要注意的是,我们讨论的Teradata DBC是30多年前的一个型号机器与系统的基本情况。

Teradata IFP的示意图如图14.11所示。由图可知,通过引导程序进入IFP。IFP负责处理用户请求、语法分析、查询分解,等等。IFP的主要组成模块包括主机接口(host interface)、会话控制(session control)、输入数据转换器(input data conversion)、SQL解析器(SQL parser)、调度器(dispatcher)、Ynet接口(Ynet interface)等。(www.chuimin.cn)

Teradata COP的示意图如图14.12所示。其中COP是通过网络连入的用户。

图14.10 Teradata DBC示意图

图14.11 Teradata IFP示意图

由图14.12可知,通信处理器COP的主要组成模块是网络接口(network interface)、负载均衡(load balancing)、会话控制(session control)、输入数据转换(input data conversion)、SQL解析器(SQL parser)、调度器(dispatcher)和Ynet接口(Ynet interface)等。

IFP和COP负责与数据库用户打交道,具体的数据存取则交给AMP。Teradata AMP的示意图如图14.13所示。由图可知,通过Ynet互联的AMP处理器拥有自己的内存,有独立的I/O处理器,有独立的管理数据的存储单元(这里记为DSU1、DSU2、DSU3和DSU4)。由专用的高速总线将处理器和存储器连接在一起。

图14.12 Teradata COP示意图

图14.13 Teradata AMP示意图