首页 理论教育基于似然性方法检测差异基因的研究成果

基于似然性方法检测差异基因的研究成果

【摘要】:Hu在2008年提出了LRS方法,LRS方法是基于似然性方法在基因表达谱数据中寻找癌症组样本基因表达强度的改变点,识别有差异表达的癌症基因,选取最大似然率进行癌症组样本检测。,n时,xij表示癌症组样本的基因表达强度。采用函数v=,其中Φ表示标准正态分布函数,对于0≤m0<m1<n和b>0,则有直接将LRS方法应用在相反的情况下,检测癌症组样本中过低调节的差异基因表达值。

Hu在2008年提出了LRS方法,LRS方法是基于似然性方法在基因表达谱数据中寻找癌症组样本基因表达强度的改变点,识别有差异表达的癌症基因,选取最大似然率进行癌症组样本检测。微阵列基因表达谱数据g×n矩阵包含g行基因,n列样本,样本中的数据满足正态分布。令i表示基因,i=1,2,…,g。n表示样本数目,正常组样本有n1个,癌症组样本有n2个,则n=n1+n2。j表示样本,xij表示样本表达强度,当j=1,2,…,n1时,xij表示正常组样本基因表达强度;当j=n1+1,n1+2,…,n时,xij表示癌症组样本的基因表达强度。令x1,…,xj,…,xn是独立的随机变量,满足x1,…,xn1 iid.~F1,xj,…,xn iid.~F2,其中F1为已知的正常组样本,F2为未知的癌症组样本,F1和F2是两个不相等的连续正态分布函数。令变点发生在第j个样本,j(1≤j<n)或j/n(记为t0)为序列x1,…,xj,…,xn的变点。令原假设和对立假设为:

即x1,…,xj,…,xn有相同的分布,存在某个x0∈(0,1)使得F1(x0)≠F2(x0)。

考虑癌症组样本中存在过高表达,则正常组样本就排在癌症组样本前面,将样本按xi1,xi2,…,xin1,xi(n1+1),xi(n1+2),…,xin排序,癌症组样本按它们的表达强度递增排序xi2,表示为xi(n1+1),xi(n1+2),…,xin。所有样本表达强度的和为:

LRS方法假设的计算公式如下:(www.chuimin.cn)

式中,Sj是前j个样本的表达强度之和。根据经验我们只关心癌症组样本中变点的表达强度,把下界m0降为n1+1,上界m1提高到n-1。采用函数v(x)=,其中Φ表示标准正态分布函数,对于0≤m0<m1<n和b>0,则有

直接将LRS方法应用在相反的情况下,检测癌症组样本中过低调节的差异基因表达值。