首页 理论教育差异表达基因检测数据分析研究成果

差异表达基因检测数据分析研究成果

【摘要】:差异表达基因检测普遍采用的方法是计算T统计方法,T统计方法通过两组样本的均值来判断基因是否存在表达差异。差异基因表达检测研究通过在不同实验条件下基因表达水平的显著性变化来判断基因的差异性,通常采用假设检验原理,把样本分为正常组样本和癌症组样本两类,或者分为两种条件下的多次重复试验,并对此进行判断。T统计方法通常用于检测两组样本均值的显著差异性,在差异基因表达检测中,它也是常用的较简洁的统计方法。

差异表达基因检测普遍采用的方法是计算T统计方法,T统计方法通过两组样本的均值来判断基因是否存在表达差异。COPA方法使用中值和中值绝对离差来表示数据转换的变化。OS方法在COPA方法的基础上增加了分位数作为附加表达式来识别癌症组样本的表达强度。与OS方法类似的ORT方法是使用癌症组样本来表示数据转换的变化。

差异基因表达检测研究通过在不同实验条件下基因表达水平的显著性变化来判断基因的差异性,通常采用假设检验原理,把样本分为正常组样本和癌症组样本两类,或者分为两种条件下的多次重复试验,并对此进行判断。

T统计方法通常用于检测两组样本均值的显著差异性,在差异基因表达检测中,它也是常用的较简洁的统计方法。在T统计方法的基础上,提出对T统计方法进行改进的相对正常组样本的半T统计方法(HXT),由此提出相对癌症组样本的半T统计方法(HYT)和增加参数的半T统计方法(AHXT)。本章引入了蒙特卡洛方法和ROC曲线对T统计方法、改进的相对正常组样本的半T统计方法,以及相对癌症组样本的半T统计方法和增加参数的半T统计方法进行性能评价和对比分析[150]。(www.chuimin.cn)

把基因微阵列数据看作g×n的矩阵,该微阵列基因表达谱数据中有g行基因,n个样本的属性,检测差异基因表达的二分类基因表达谱数据,把基因表达谱数据的一个实验条件或一个属性看作一个样本,正常组样本数目用n0表示,癌症组样本数目用n1表示,n为n0和n1的样本数目的和。