许多研究者对此进行了研究,并提出了多种差异表达基因检测方法。OPA方法采用基因组数据异常分析的非参数方法对某特定基因进行检测,这个基因的基因芯片数据的一个组中只有一部分样本相对于另一组样本过高表达,剩余的样本没有差异表达的迹象。PACK方法、PADGE方法、PPRM方法、OPA方法、LRS方法也研究了假定癌症组子集样本相对于正常组样本有过高或过低表达的差异基因表达检测统计方法。......
2023-11-21
传统的差异表达基因检测方法是在正常组样本和癌症组样本中,假定癌症组所有样本相对于正常组样本都是过表达的,将不同的表达按分布的不同特征进行检测[98]。2005年,Tomlins等人发现了一种不同的差异表达模型,一些致癌基因只在癌症组样本的一小部分中存在异常,这类基因的差异表达检测需要考虑癌症组样本子集相对于正常组样本是过表达的,即一个组中的一部分样本相对于另一个组样本有过高或过低的差异表达,这引起了许多学者的广泛关注[99]。
基于假定癌症组所有样本相对于正常组样本都有过高或过低表达的差异表达基因检测统计方法,没有考虑到癌症基因的活化性特点。2005年,Tomlins等人在研究前列腺癌时,将基因活化的异质性引入差异表达基因检测统计方法中,指出差异基因表达可以在癌症组样本子集中过表达,而不是在癌症组所有样本中都存在过表达的情况,从而提出了COPA(Cancer Outlier Profile Analysis)方法,用于检测癌症组样本子集相对于正常组样本过表达的差异表达基因检测[100],这种方法的提出启发了多种方法进行差异表达基因检测的研究。
本书主要研究基因芯片数据癌症组样本子集相对于正常组样本部分过表达的差异表达基因检测方法,融合了样本值、样本中值和中值绝对离差表示数据转换变化的思想,提出了基于样本三均值方法表示数据转换变化的差异表达基因检测方法。(www.chuimin.cn)
本章重点介绍了差异表达基因检测的生物学背景及其常用统计学方法,并进行了对比分析,具体安排如下:2.1节介绍差异表达基因发生在癌症组样本子集中过表达的生物学背景;2.2节介绍基于分位数判断的基因芯片数据癌症组样本子集过表达的差异表达基因检测的统计方法;2.3节对上述差异表达基因检测统计方法进行实验,并比较分析。
有关差异表达基因检测数据分析研究的文章
许多研究者对此进行了研究,并提出了多种差异表达基因检测方法。OPA方法采用基因组数据异常分析的非参数方法对某特定基因进行检测,这个基因的基因芯片数据的一个组中只有一部分样本相对于另一组样本过高表达,剩余的样本没有差异表达的迹象。PACK方法、PADGE方法、PPRM方法、OPA方法、LRS方法也研究了假定癌症组子集样本相对于正常组样本有过高或过低表达的差异基因表达检测统计方法。......
2023-11-21
发现差异表达基因是微阵列实验研究的主要目的之一[44-47]。传统的差异表达基因检测方法基于癌症组所有样本的基因表达强度一致地为过高或过低表达这样一个假定[69,70],如传统的T统计方法是对比两组表达值分布的均值,从而检测其差异[25]。差异表达基因检测方法不仅在统计量方面发展迅速,而且加强了对FDR错误发现率的控制,以减少假阳性并充分发挥数据分析的作用[71,72]。常用的传统差异表达基因检测方法如下。......
2023-11-21
差异表达基因检测可以寻找相对于正常组织过高或过低调节的癌症组织,在医学临床诊断、药物疗效判断、揭示癌症疾病发生机制等方面都有重要的作用。本书总结了Tomlins等人关于癌症组样本子集过表达的差异表达基因检测统计方法,同时通过模拟研究和真实数据的检验,比较分析了这些差异表达基因检测方法,并提出了改进的差异表达基因检测方法。......
2023-11-21
在COPA方法的基础上,Tibshirani等人在2007年提出的OS方法引入了分位数做启发式规则附加表达值,进行差异表达基因检测。由于差异估算中用正常组样本中值代替了全部数据的中值,ORT方法比COPA方法和OS方法恰当地估计了两组数据的差异。COPA方法和OS方法随差异数目的增加,性能有所降低。Lian在2008年提出的MOST方法隐性地考虑了差异基因表达强度临界值所有可能的取值,通过确定其统计量最大值来确定阈值,从而检测差异表达基因。......
2023-11-21
差异表达基因检测不仅具有统计学意义,而且具有生物学意义,在医学临床诊断、药物疗效判断、揭示疾病发生机制等方面都有重要的作用。在医学研究中,癌症差异表达基因检测就是一个重要的问题。差异表达基因检测统计方法的目的是识别由于实验环境变化而引起的表达水平改变的基因[43]。在基因芯片数据分析中,差异表达基因检测的传统方法通常是假定所有癌症组样本相对于正常组样本都具有过高或过低的表达。......
2023-11-21
样本三均值trimeani:正常组样本三均值trimeanix:癌症组样本三均值trimeaniy:基于ORT方法改进的TriORT方法的统计量TriORT*i定义如下:基因i的癌症组样本集合过高表达时的定义为:其过低表达时的定义为:TriORT方法和ORT方法的不同之处在于,ORT方法中表示数据转换变化的中值和中值绝对离差分别被三均值和三均值绝对离差来代替,这样使得数据稳健,能全面地反映样本数据特征。......
2023-11-21
COPA方法是基于癌症组样本数据的第r分位数来确定差异基因表达值的。OS方法计算OS*i统计量,并且引入启发式规则附加表达值,利用分位数的知识对基因芯片数据进行基因表达的差异表达基因检测。在式中,差异表达基因的数量默认为个。COPA方法、OS方法、ORT方法和MOST方法的共同特点是以参数方法,采用样本基因表达强度的中值和中值绝对离差定义差异基因表达的统计量,都利用基因表达的分位数检测差异基因表达。......
2023-11-21
在差异表达基因检测统计方法中,传统的T统计方法假设所有癌症组样本相对于正常组样本都是过表达的。Wu在2007年提出的ORT方法对OS方法进行了改进。Lian在2008年提出的MOST方法考虑了差异基因表达所有可能的临界值。当活跃样本数目未知时,MOST方法比其他方法更有效;当活跃样本数目较少时,其效果与ORT方法相似;当差异表达的样本数目较多时,MOST方法的效果较好[103]。......
2023-11-21
相关推荐