首页 理论教育TriORT方法和TriMOST方法比较

TriORT方法和TriMOST方法比较

【摘要】:本书提出了两种差异表达基因检测方法,即TriORT方法和TriMOST方法。同时,TriORT方法引入了分位数作为启发式规则附加表达值,进行差异表达基因检测。TriMOST方法计算统计量TriMOSTik,首先,计算基因表达谱中定义正常组样本的三均值统计量,癌症组样本的三均值统计量,所有样本的三均值绝对离差统计量。考虑每个可能的阈值,把在TriMOSTik之上的所有yij可能的值默认为差异表达值。TriORT方法是基于ORT方法建立的,TriMOST方法是基于MOST方法建立的,检测效果都比较好。

本书提出了两种差异表达基因检测方法,即TriORT方法和TriMOST方法。这两种方法均使用样本三均值和三均值绝对离差来表示数据转换的变化,并综合运用了上四分位数、下四分位数和中位数三个数据,把距离中位数较远的信息也包括进来[135]。在均值、中值和三均值中,只有三均值不能看作切尾均值,这样用三均值既能全面反映基因芯片中样本数据的特征,又能保证样本数据的稳健性。

在基因芯片数据中利用公式计算正常组样本数据的三均值,利用公式trimeaniy计算癌症组样本数据的三均值。

TriORT方法计算统计量,是癌症组样本数据和正常组样本数据三均值的差{yij1≤j≤n1-trimeanix,再除以得到的值。同时,TriORT方法引入了分位数作为启发式规则附加表达值,进行差异表达基因检测。利用四分位数间距IQR(i)=q75(i)-q25(i)度量数据的分散性,具有对异常数据抗干扰性等特点,值大于q75(i)+IQR(i)和小于q25(i)-IQR(i)的数据在统计意义上称为差异表达值,即癌症组样本表达强度大于基因表达强度的上四分位数或小于下四分位数的基因就是差异表达基因。因此,当过高表达时,计算IQR({xij1≤j≤n0)}值,以求得过高表达的差异基因;当过低表达时,计算值,以求得过低表达的差异基因,进行差异表达基因检测,识别差异基因。

TriMOST方法计算统计量TriMOSTik,首先,计算基因表达谱中定义正常组样本的三均值统计量,癌症组样本的三均值统计量,所有样本的三均值绝对离差统计量。其次,将癌症组基因表达强度值从大到小排序,当癌症基因活跃的样本数目k(1≤k≤n1)已知时,定义每一个基因的TriMOSTik统计量为(www.chuimin.cn)

;当k值未知时,定义,z1>z2>…>zn1是从标准正态分布中取出的n1个样本的排序统计量。定义每一个基因的TriMOSTik统计量为。每一个基因TriMOSTi统计量为。使用癌症组样本构成限定值,对癌症组样本中n1个样本求和。考虑每个可能的阈值,把在TriMOSTik之上的所有yij可能的值默认为差异表达值。

TriORT方法是基于ORT方法建立的,TriMOST方法是基于MOST方法建立的,检测效果都比较好。