首页 理论教育垂直分片对分布式数据库技术的影响

垂直分片对分布式数据库技术的影响

【摘要】:本节考虑数据片Ri的垂直分片问题。下面考察这种垂直分片导致的影响。令A 2为一个应用集合,这类应用在r节点上发布,但同时涉及Rs和Rt上的属性,这类应用需要两个额外的远程访问。现在考虑一个数据片Ri,如果把它分成两个数据片Rs和Rt,并分别分配到节点s和t上。集聚要求重新考虑垂直分片的应用分组。A 2包含以前在r上的更新应用,它们希望更新R的属性,而此时需要同时存取Rs和Rt。可以通过估算前述的表达式Bit来计算收益。

本节考虑数据片Ri的垂直分片问题。

假设Ri原来分配在节点r上,现在考虑将之分成两个数据片Rs和Rt,并各自分配到节点s和t上。下面考察这种垂直分片导致的影响。

首先定义以下必要的参数。

(1)令As和At为两个应用集合,这类应用在节点s或t上发布,只使用本地Rs中的属性或本地Rt中的属性,这类应用由于分配合理而省去了远程访问。

(2)令A1为一个应用集合,这类应用在r节点上发布,但只涉及Rs或Rt上的属性,这类应用由于分配而需要一个额外的远程访问。

(3)令A 2为一个应用集合,这类应用在r节点上发布,但同时涉及Rs和Rt上的属性,这类应用需要两个额外的远程访问。

(4)令A3是另外一个应用集合,它在r、s或t以外的节点上发布,但同时访问Rs或Rt的属性,这类应用需要一个额外的远程访问。这样可以使用下面的式子来估算收益。(www.chuimin.cn)

为了简化,这里忽略了存取和更新成本的比例。

现在考虑一个数据片Ri,如果把它分成两个数据片Rs和Rt,并分别分配到节点s和t上。它们之间的重复属性为I。集聚要求重新考虑垂直分片的应用分组。

(1)As包含分配在节点s的应用,它们可能是:读Rs的任何属性,或者修改Rs的属性,这些属性与At中包含的属性不重复。

(2)A 2包含以前在r上的更新应用,它们希望更新R的属性,而此时需要同时存取Rs和Rt

(3)A 3包含在与r、s或t不同站点上的应用,它们需要更新R的属性,而此时需要同时存取Rs和Rt

可以通过估算前述的表达式Bit来计算收益。