已经存在的多序列比对算法主要有三类:精确比对算法,渐进式比对算法和迭代比对算法。Thompson和Higgins于1994年对渐进式多序列比对算法进行了实现,提出了Clustal W算法。它在数据量较大和距离较远的序列比对中更准确,且消耗时间更短,该算法还在不断改进以适应数据量剧增的多序列比对需求。......
2023-10-25
在序列比对的过程中,由于无法使用能否准确反映生物学意义这一概念来衡量序列比对结果的质量,因此我们引入了目标函数(objective function,OF)这一数学模型对序列比对结果进行评价。在双序列比对中,对比对结果进行打分较为容易,我们可直接根据相应的替换矩阵与罚分模型进行计算,且分数的高低可以较好地体现生物学意义。然而,在多序列比对中,目标函数的计算要复杂得多,且如何选择合适的目标函数也需要加以考虑。理论上目标函数可以尽可能准确、有效地反映多序列比对结果的质量,并能发现更多的生物学意义。目前,对于目标函数的研究还在持续地进行,相关的优化方式也在不断提出。广泛使用的目标函数主要有两种:比对和函数(sum-of-pairs function)以及COFFEE函数(consistency based objective function for alignment evaluation)。
比对和函数的分值简称为SP值,基于SP的多序列比对已被证明是一个NP难题。比对和函数的理论基础是得分函数具有相加性,多序列比对的得分可以通过序列两两之间的比对得分相加得到。比对和函数的得分(score)计算公式如下:
alignment(Si,Sj)表示下标顺序为i、j的两条序列的双序列比对得分。如果有一个多序列比对结果的得分值为score(A')且score(A')=max(score(A)),则称该多序列比对结果是一个最优比对。
COFFEE函数是在比对和函数之后提出的,目前也得到了学术界的广泛应用.它的计算方式与比对和函数的计算方式不同:它的计算不依赖替换矩阵和罚分模型,这些信息都隐藏在它根据双序列比对建立的扩展库中。COFFEE函数反映的是多序列比对和序列组中两两比对形成的扩展库之间的一致性程度。COFFEE函数的提出可以让更多的双序列比对算法思想用于多序列比对,且其准确性相较于比对和函数有所提升,尤其在序列相似度较低时,但其计算的速度相较于比对和函数更慢。
COFFEE函数的使用主要由两部分组成:(www.chuimin.cn)
(1)根据双序列比对建立扩展库,扩展库中至少需包含序列组中所有两两比对的情况;
(2)计算多序列比对和扩展库信息一致性的COFFEE函数。具体的COFFEE函数计算公式如下:
其中,Aij代表序列Si和Sj的双序列比对,len(Aij)代表比对长度,score(Aij)代表多序列比对和扩展库中Aij比对结果的匹配残基数目,Wij表示双序列比对的权值,该权值最简单的计算方式是直接赋值为双序列比对相似度百分比。
有关形式化开发多序列比对算法的文章
已经存在的多序列比对算法主要有三类:精确比对算法,渐进式比对算法和迭代比对算法。Thompson和Higgins于1994年对渐进式多序列比对算法进行了实现,提出了Clustal W算法。它在数据量较大和距离较远的序列比对中更准确,且消耗时间更短,该算法还在不断改进以适应数据量剧增的多序列比对需求。......
2023-10-25
通过对目前常用的多序列比对算法进行研究,利用FODM的建模方法对MSAA进行特征建模。多序列比对操作是MSAA的核心服务,双序列比对操作、系统发生树构建操作、启发式多序列比对操作,目标函数是该领域中的主要功能,其中双序列比对操作、系统发生树构建操作为可选择的功能,目标函数和启发式多序列比对是必选的功能。此外,目标函数计算参数选择也是其行为特点,包括罚分模型和替换矩阵两个值。图5-1MSAA的特征模型......
2023-10-25
本节根据MSAA的特征模型和渐进式比对算法构件的交互模型,利用Apla语言的高抽象性、对泛型及ADT的良好支持以及易于正确性验证等优点,来形式化实现多序列比对算法构件。prog构件该构件为ADT类型HMSAA中的泛型子程序,根据传入不同类型的计算比对步骤进行渐进式比对。result_op构件该构件为ADT类型,泛型子程序multiAlign_op在多序列比对结果的基础上,对结果进行格式化输出。......
2023-10-25
变换的开始、中间到结束、产物是一符号串,这种形式化方法称为完全形式化方法。所以,目前软件开发的形式化方法主要是以部分形式化方法为主。总体上,形式化软件开发方法大致可分为以下五类:基于模型的方法。......
2023-10-25
本实验采用C++语言,使用VS2019集成开发环境。替换矩阵采用Clustal W中默认的IUB矩阵。最终比对结果与Clustal W和Clustal O的比对结果,如图5-7所示。图5-7算法结果比较通过对PAR方法和PAR平台的使用,我们运用Apla语言以半自动的方式组装形成了基于系统发生树的渐进式比对算法,并将Apla程序转换成了C++代码,得到了可运行的算法程序,算法结果与Clustal W和Clustal O进行了比较,基本的保守位点和相似区域都可有效发现,具有一定的生物学意义。......
2023-10-25
图6-1模块交互关系构件库模块。该模块主要包括两部分,一部分是存储在文件中已完成转换的构件源代码,另一部分是存储在数据库中需进行人工开发或修改的Apla构件组装代码。在完成构件选择后,该模块根据选择的构件,从后台数据库中获取所需的Apla组装代码,用户可对组装代码进行相应的修改,以正确调用构件库中被选择的构件。......
2023-10-25
虚线箭头表示在算法执行过程中两个构件之间需进行交互,例如多序列比对模式构件需调用双序列比对构件、目标函数构件、系统发生树构件来进行组装操作。......
2023-10-25
相关推荐