样本三均值trimeani:正常组样本三均值trimeanix:癌症组样本三均值trimeaniy:基于ORT方法改进的TriORT方法的统计量TriORT*i定义如下:基因i的癌症组样本集合过高表达时的定义为:其过低表达时的定义为:TriORT方法和ORT方法的不同之处在于,ORT方法中表示数据转换变化的中值和中值绝对离差分别被三均值和三均值绝对离差来代替,这样使得数据稳健,能全面地反映样本数据特征。......
2023-11-21
本书提出了两种差异表达基因检测方法,即TriORT方法和TriMOST方法。这两种方法均使用样本三均值和三均值绝对离差来表示数据转换的变化,并综合运用了上四分位数、下四分位数和中位数三个数据,把距离中位数较远的信息也包括进来[135]。在均值、中值和三均值中,只有三均值不能看作切尾均值,这样用三均值既能全面反映基因芯片中样本数据的特征,又能保证样本数据的稳健性。
在基因芯片数据中利用公式计算正常组样本数据的三均值,利用公式trimeaniy=计算癌症组样本数据的三均值。
TriORT方法计算统计量,是癌症组样本数据和正常组样本数据三均值的差{yij}1≤j≤n1-trimeanix,再除以得到的值。同时,TriORT方法引入了分位数作为启发式规则附加表达值,进行差异表达基因检测。利用四分位数间距IQR(i)=q75(i)-q25(i)度量数据的分散性,具有对异常数据抗干扰性等特点,值大于q75(i)+IQR(i)和小于q25(i)-IQR(i)的数据在统计意义上称为差异表达值,即癌症组样本表达强度大于基因表达强度的上四分位数或小于下四分位数的基因就是差异表达基因。因此,当过高表达时,计算IQR({xij}1≤j≤n0)}值,以求得过高表达的差异基因;当过低表达时,计算值,以求得过低表达的差异基因,进行差异表达基因检测,识别差异基因。
TriMOST方法计算统计量TriMOSTik,首先,计算基因表达谱中定义正常组样本的三均值统计量,癌症组样本的三均值统计量,所有样本的三均值绝对离差统计量。其次,将癌症组基因表达强度值从大到小排序,当癌症基因活跃的样本数目k(1≤k≤n1)已知时,定义每一个基因的TriMOSTik统计量为(www.chuimin.cn)
;当k值未知时,定义,z1>z2>…>zn1是从标准正态分布中取出的n1个样本的排序统计量。定义每一个基因的TriMOSTik统计量为。每一个基因TriMOSTi统计量为。使用癌症组样本构成限定值,对癌症组样本中n1个样本求和。考虑每个可能的阈值,把在TriMOSTik之上的所有yij可能的值默认为差异表达值。
TriORT方法是基于ORT方法建立的,TriMOST方法是基于MOST方法建立的,检测效果都比较好。
有关差异表达基因检测数据分析研究的文章
样本三均值trimeani:正常组样本三均值trimeanix:癌症组样本三均值trimeaniy:基于ORT方法改进的TriORT方法的统计量TriORT*i定义如下:基因i的癌症组样本集合过高表达时的定义为:其过低表达时的定义为:TriORT方法和ORT方法的不同之处在于,ORT方法中表示数据转换变化的中值和中值绝对离差分别被三均值和三均值绝对离差来代替,这样使得数据稳健,能全面地反映样本数据特征。......
2023-11-21
定性研究与定量研究的争论反映出方法各自的优点、缺点和适用范围。由于社会研究对象是人和人类社会,而社会是一个多变量、多因素、多层次的复杂的动态系统,社会研究方法论并不是唯一的,而是多元的,存在着多种研究范式。......
2023-08-13
针对研究的核心问题,本书主要采用两种研究方法: 一是实证调研方法;二是比较研究方法。通过运用实证研究和比较研究方法,对我国、荷兰、美国高校内部学生申诉制度进行系统研究,试图分析该法律制度运行背后的理论框架,即国家规制对法律制度运行及其功能的影响。而对美国公立高校内部学生申诉制度的研究,则只能依靠二手资料停留在规范研究层面,无法进行深入细致的实证调研。......
2023-07-03
不过,人们对《史记》、《汉书》的研究多从史学角度着眼,从文学角度着眼主要是近半个世纪以来的事。目前还没有出现专门的《史》、《汉》叙事研究专著,重复研究大量存在,有必要对《史》、《汉》叙事进行研究和比较。《史记》、《汉书》的研究资料所在不少,然而,要对两书进行系统的比较研究,却又殊非易事,主要原因在于两书皆博大浩瀚。......
2023-08-20
在COPA方法的基础上,Tibshirani等人在2007年提出的OS方法引入了分位数做启发式规则附加表达值,进行差异表达基因检测。由于差异估算中用正常组样本中值代替了全部数据的中值,ORT方法比COPA方法和OS方法恰当地估计了两组数据的差异。COPA方法和OS方法随差异数目的增加,性能有所降低。Lian在2008年提出的MOST方法隐性地考虑了差异基因表达强度临界值所有可能的取值,通过确定其统计量最大值来确定阈值,从而检测差异表达基因。......
2023-11-21
,成立.下面证明n充分大时有记f=[3x(1-x)]n,则f在[0,1]上连续,在(0,1)内可导且所以,在[0,1]上,f的最大值为.从而由此证得,当n充分大时有......
2023-10-27
加之女装在当代服装行业中所占据的比重、市场份额及其变化幅度和速度,它对当今及未来服饰文化的发展具有更显著的影响力,因此本文选取女装作为比较对象。书中的“女装”是指在中法两国的一些中心城市,上流社会女性所穿着的、与时代前沿思潮和文化状态等紧密相连的,能反映出时代发展脉搏的典型女装。......
2023-06-23
表2-4工业社会的三个阶段续表2.比较教育研究的三层次理论埃德蒙·金认为,比较教育研究的具体方法应该视研究的具体目标和课题而定,因此将比较教育研究分为三级水平,并提出了每级水平的研究内容与方法。总而言之,埃德蒙·金的比较教育思想体现了比较教育研究领域的范式转换,为比较教育研究的进一步发展,开拓了一种新的理论研究视角与研究方向。......
2023-09-25
相关推荐