首页 理论教育多序列比对算法:渐进式设计

多序列比对算法:渐进式设计

【摘要】:经过上述分析,我们可以对图5-2中的交互模型做进一步细化,将模型中关于渐进式比对的构件进行拆分,形成图5-4所示的渐进式多序列比对算法构件交互模型。图5-3常见的渐进式比对算法的步骤下面对关键构件进行简单的形式化描述,以便于该领域算法构件的实现。seq_check构件图5-4渐进式多序列比对算法构件交互模型msa_mode构件|[in user settings out msa_mode:ADT]|AQ:用户的相关设置。

通过对各种渐进式多序列比对算法进行分析,得出常见的渐进式比对步骤如图5-3所示。它们的共同点是:都需要进行序列之间的双序列比对,最后根据目标函数确定最佳近似比对的操作。不同之处在于:选择了SP目标函数的,常用的是根据系统发生树或星比对算法来确定比对顺序;选择了COFFEE目标函数的,常用的是通过双序列比对信息构建扩展库以指导多序列比对。经过上述分析,我们可以对图5-2中的交互模型做进一步细化,将模型中关于渐进式比对的构件进行拆分,形成图5-4所示的渐进式多序列比对算法构件交互模型。

图5-3 常见的渐进式比对算法的步骤

下面对关键构件进行简单的形式化描述,以便于该领域算法构件的实现。

(1)seq_check构件

图5-4 渐进式多序列比对算法构件交互模型

(2)msa_mode构件

|[in user settings out msa_mode:ADT]|

AQ:用户的相关设置。

AR:指定算法类型,并完成相应的ADT组装操作。

(3)prog_align构件

AQ:目标函数参数,系统发生树构件、中心星比对构件或扩展库构件的结果,需进行比对的序列组。

AR:多序列比对结果。

(4)result_op构件

AQ:多序列比对结果,系统发生树结果以及两者的输出路径

AR:系统发生树结果输出,比对结果输出。

(5)psa构件(www.chuimin.cn)

AQ:目标函数构件中的相关参数,序列组。

AR:双序列比对结果的分值。

(6)dist_matrix构件

|[in psa:ADT;out distMat:double[][]]|

AQ:双序列比对构件。

AR:序列之间的距离矩阵

(7)phy_tree构件

|[in distMat:ADT out phy_tree:ADT]|

AQ:距离矩阵构件。

AR:系统发生树结果。

(8)center构件

|[in distMat:ADT out center:ADT]|

AQ:距离矩阵构件。

AR:中心星比对结果。

(9)extend_lib构件

|[in psa:ADT out lib:ADT]|

AQ:双序列比对构件。

AR:比对扩展库结果。