首页 理论教育水平分片技术的实施方法与收益

水平分片技术的实施方法与收益

【摘要】:我们把Ri放入对Ri的访问最多的节点上。使用“所有有益节点”方法实施副本分配,可以考虑在一个节点增放一个Ri副本,这对于检索应用来说方便了,这是收益。在副本分配中使用增量复制,放置一个Ri新副本后的好处是,可以从提高系统的可靠性和可用性上考虑。然后可以使用修改(即补偿)过的公式计算在节点j上存放一个新副本Ri时的收益:这个公式可以用来估算数据重复度的合适程度。

下面介绍分配算法

(1)使用“最佳适配”方法为每个数据片进行非冗余分配。我们把Ri放入对Ri的访问最多的节点上。在节点j上对Ri的访问数是本地访问数,是收益,可以记为

我们把Ri放入Bij*最大的节点j*上。

(2)使用“所有有益节点”方法实施副本分配,可以考虑在一个节点增放一个Ri副本,这对于检索应用来说方便了,这是收益。而对于更新应用来说,增加了开销,两者之差就是纯收益。所以使用Bij来估算纯收益,公式如下:

这里,C是一个常数,表征更新开销和存取开销之间的差异。典型情况是,更新开销大于存取开销,原因是更新开销需要更多的控制消息和本地操作,所以一般C>1。(www.chuimin.cn)

在所有Bij为正的节点中,选择Bij中最大的节点作为下一个副本的放置点,如此递归,直至Bij都为负为止。

(3)在副本分配中使用增量复制,放置一个Ri新副本后的好处是,可以从提高系统的可靠性可用性上考虑。但要注意的是,增放副本的收益并非随着冗余度的增加而呈线性增长。令di为Ri的冗余度,Fi为Ri在每个节点上全复制时的收益。可以用一个β(di)函数来量度这种收益,令:

这里,β(1)=0,β(2)=Fi/2,β(3)=3Fi/4,依此类推。然后可以使用修改(即补偿)过的公式计算在节点j上存放一个新副本Ri时的收益:

这个公式可以用来估算数据重复度的合适程度。