首页 理论教育差异表达基因检测样本子集的统计方法

差异表达基因检测样本子集的统计方法

【摘要】:2005年,Tomlins等人发现了一种不同的差异表达模型,一些致癌基因只在癌症组样本的一小部分中存在异常,这类基因的差异表达检测需要考虑癌症组样本子集相对于正常组样本是过表达的,即一个组中的一部分样本相对于另一个组样本有过高或过低的差异表达,这引起了许多学者的广泛关注[99]。基于假定癌症组所有样本相对于正常组样本都有过高或过低表达的差异表达基因检测统计方法,没有考虑到癌症基因的活化性特点。

传统的差异表达基因检测方法是在正常组样本和癌症组样本中,假定癌症组所有样本相对于正常组样本都是过表达的,将不同的表达按分布的不同特征进行检测[98]。2005年,Tomlins等人发现了一种不同的差异表达模型,一些致癌基因只在癌症组样本的一小部分中存在异常,这类基因的差异表达检测需要考虑癌症组样本子集相对于正常组样本是过表达的,即一个组中的一部分样本相对于另一个组样本有过高或过低的差异表达,这引起了许多学者的广泛关注[99]

基于假定癌症组所有样本相对于正常组样本都有过高或过低表达的差异表达基因检测统计方法,没有考虑到癌症基因的活化性特点。2005年,Tomlins等人在研究前列腺癌时,将基因活化的异质性引入差异表达基因检测统计方法中,指出差异基因表达可以在癌症组样本子集中过表达,而不是在癌症组所有样本中都存在过表达的情况,从而提出了COPA(Cancer Outlier Profile Analysis)方法,用于检测癌症组样本子集相对于正常组样本过表达的差异表达基因检测[100],这种方法的提出启发了多种方法进行差异表达基因检测的研究。

本书主要研究基因芯片数据癌症组样本子集相对于正常组样本部分过表达的差异表达基因检测方法,融合了样本值、样本中值和中值绝对离差表示数据转换变化的思想,提出了基于样本三均值方法表示数据转换变化的差异表达基因检测方法。(www.chuimin.cn)

本章重点介绍了差异表达基因检测的生物学背景及其常用统计学方法,并进行了对比分析,具体安排如下:2.1节介绍差异表达基因发生在癌症组样本子集中过表达的生物学背景;2.2节介绍基于分位数判断的基因芯片数据癌症组样本子集过表达的差异表达基因检测的统计方法;2.3节对上述差异表达基因检测统计方法进行实验,并比较分析。