在差异表达基因检测统计方法中,传统的T统计方法假设所有癌症组样本相对于正常组样本都是过表达的。Wu在2007年提出的ORT方法对OS方法进行了改进。Lian在2008年提出的MOST方法考虑了差异基因表达所有可能的临界值。当活跃样本数目未知时,MOST方法比其他方法更有效;当活跃样本数目较少时,其效果与ORT方法相似;当差异表达的样本数目较多时,MOST方法的效果较好[103]。......
2023-11-21
实验十二 基因表达的系列分析(SAGE)技术
基因组是一个生命体遗传信息的总和。确定基因组DNA序列是揭示生命活动规律、探讨疾病发生机制的基础。人类基因组计划的完成为人类疾病的遗传学研究奠定了坚实的基础,并成为现代生物医学研究的一个重要的里程碑。但是在人类基因组中,基因的数目远远低于蛋白质的种类,这预示着基因表达及其表达产物的加工是更为复杂的过程。因此,转录组学(transcriptomics)和蛋白组学(proteomics)成为后基因组学时代的核心研究方向。转录组学和蛋白组学分别从mRNA和蛋白质两个层面上剖析基因的功能和调控机制。基因芯片技术和基因表达的系列分析(serialanalysis of gene expression,SAGE)为基因表达研究提供了高效的手段。
基因表达的系列分析(SAGE)是由Velculescu等建立并用以分析基因组表达的方法。与mRNA差异展示(mRNA differential display,DDRT)、抑制性消减杂交(suppression subtractive hybridization,SSH)、差异消减展示(differential subtraction display,DSD)及基因芯片等方法相比,SAGE可以在未知目的基因的前提下,分析来自一个细胞的全部转录本信息;对已知或未知基因表达进行定性和定量分析;具有假阳性率低、可重复性强等优点。
由于SAGE技术的所具有的特点,使其受到广泛重视,并通过改进形成了多种SAGE方法。1998年,Powell率先使用生物素标记PCR引物,PCR产物通过与携带亲和素的磁珠交联,而获得目的cDNA,从而增加了目的标签的产量以及效率。为了解决SAGE需要较大量RNA的问题,Datson等提出了MicroSAGE方法,通过优化mRNA提取过程、调整PCR反应循环步骤以及使用亲和素连接的PCR反应试管,使得分析的mRNA样品量减少到1~5ng,完全满足了SAGE技术在组织活检标本、微量组织细胞分析上应用的需要。其后,Ye等创造了miniSAGE技术,其技术特点是使用了mRNAcapture试剂盒,从而使mRNA分离以至cDNA标签的分离在一个试管中进行,减少了样品量的损失;减少了连接反应中连接子的量,从而降低了连接子对PCR扩增反应的干扰,提高双标签的产率;通过phaselock凝胶,以增加每次苯酚抽提后DNA回收率和纯度。随着SAGE技术的日益成熟,在基因表达方面已经得到了广泛的使用。
1.SAGE的原理
mRNA的3`末端特定部位存在可以标上其特异性的标签(tag),其长度一般在10~14个核苷酸之间,检测tag可以获得该mRNA的表达信息。SAGE技术主要是基于以上原理,通过获得tag从而确定基因的表达情况。其次,分离获得的tag可以通过串联连接克隆于载体上,以便测序,提高了分析效率。同时,根据同一tag重复次数,可以判断转录本的表达水平。
2.操作步骤
①提取RNA,并将其与携带生物素标记的oligodT混合,以mRNA为模板,经逆转录得到双链cDNA。
②锚定酶(anchoringenzyme,AE)酶切生物素标记的双链cDNA。锚定酶要求至少在每一种转录本上有一个酶切位点,一般4碱基限制性内切酶能达到这种要求。NiaⅢ是一种广泛的限制性内切酶,平均每250bp就存在一个NiaⅢ识别位点CATG,因此是理想的SAGE锚定酶。
③应用带有亲和素的磁珠分离生物素标记的cDNA3′端酶解片段,获得mRNApolyA尾部与最近的酶切位点之间的片段。
④将分离得到的cDNA酶切片段等分为A和B两部分,分别与设计好的两种连接子A或B连接。连接后的DNA片段在3′端包含有ⅡS型内切酶(如BsmFⅠ)的识别位点。
⑤用ⅡS型内切酶(又称标签酶)消化以上步骤获得的连接产物,并去除与磁珠相连的DNA片段。ⅡS型内切酶的作用方式以标签酶BsmFⅠ为例,BsmFⅠ的识别和切割位点为5′-GGGAC(N)10↓-3′/3′-CCCTG(N)14↓-5′,因此产生连有接头的短cDNA片段,长为10碱基,即释放的cDNA标签,不同的标签酶获得的碱基数不同,如FokI可以获得9碱基的标签。
⑥利用Klenow片段或T4DNA聚合酶消化产生的黏性末端,混合两个cDNA池的短cDNA片段,并连接成100bp的双标签(ditag)。
⑦以引物A和B通过PCR扩增双标签,扩增产物含有2个尾尾相接的标签(一个Ditag),其侧翼有锚定酶切割位点。
⑧利用锚定酶酶切扩增产物,分离纯化以收集标签(Ditag)。
⑨将每30~50个双标签连接起来,并克隆到pZErO-1载体中,建立SAGE文库。
⑩对插入到pZErO-1载体中的双标签序列进行测序,并利用相应的应用软件进行结果分析,确定原始序列中每个标签序列、数目以及发生率。同时可以与NCBI的SAGEmap、GenBank以及EST公众数据库进行比对,找出标签与基因及EST之间的对应关系,对标签进行定性。
3.SAGE技术的应用(www.chuimin.cn)
(1)全基因组转录图谱的建立
早在1995年,Velculescu等选择BsmFI和Nia分别作为标签酶和锚定酶对胰腺组织中1000多个标签进行手工测序,发现)5%以上的标签能够代表唯一的转录物。2001年,Caron等将公众SAGE数据库的231万标签以及他们自己从神经母细胞瘤分离到的16万个标签按照组织来源分成12组,并经过计算,将这12组不同组织的标签与已做染色体定位的基因进行比对,获得了可以反映基因表达丰度的全基因组转录图谱,并发现染色体上存在高表达的基因簇区域(region of increased gene expression,RIDGE)。结果提示,基因组结构是高度有序的,一个典型的RIDGE在1cR(centiary)的染色体长度上通常含有6~30个基因,而低转录区域仅含有1~2个基因,例如在18号染色体上,目前发现有385个表达丰度较低的基因,而在大小相近的19号染色体上分布着一连串RIDGE,包含了937个基因。
(2)在基因差异表达中的研究在生物的基因组中存在两大类基因:管家基因和奢侈基因。管家基因在不同组织来源的细胞中广泛表达,而奢侈基因的表达具有组织特异性。研究组织特异性基因的表达是揭示细胞分化的基础。SAGE技术为基因差异表达的研究提供了有效的手段,在发育生物学以及肿瘤生物学中得到了广泛的应用。
通过SAGE技术对病理状态和正常生理状态的组织进行基因表达谱比较研究,可以发现疾病相关的标记基因。Sun等通过对双向性精神病进行研究,发现5-羟色胺转运蛋白和转录因子NF-κB复合体组分基因高表达,此结果成为该病的重要指征。
(3)模式生物的研究SAGE技术已经广泛地应用于其他模式生物的研究中。Velculescue等在酵母上分离得到60633个SAGE标签,其中93%的标签可与4665个基因对应。Matsumura等从水稻秧苗中分离出10122个标签,其中23.1%可与已知的1367个cDNA、EST匹配。
4.SAGE数据库及其分析相关网站
(1)http://www.sagenet.org/sage_protocol.htm
(2)http://www.sagenet.org/SAGEDatabases/unigene.htm
(3)http://www.sagenet.org/SAGEData/sagedata.htm
(4)http://www.ncbi.nlm.nih.gov/SAGE/
(5)http://genome-www4.stanford.edu/cgi-bin/SGD/SAGE/querySAGE
(6)http://www.labonweb.com/
(7)http://www-dsv.cea.fr/thema/get/sade.html
(8)http://sciencepark.mdanderson.org/ggeg/
(9)http://www.urmc.rochester.edu/smd/crc/swindex.html
(10)http://www.genzyme.com/research/gzmo/discovery/discoveryplatforms2_sage_gzmo.asp
有关生物技术制药实验的文章
在差异表达基因检测统计方法中,传统的T统计方法假设所有癌症组样本相对于正常组样本都是过表达的。Wu在2007年提出的ORT方法对OS方法进行了改进。Lian在2008年提出的MOST方法考虑了差异基因表达所有可能的临界值。当活跃样本数目未知时,MOST方法比其他方法更有效;当活跃样本数目较少时,其效果与ORT方法相似;当差异表达的样本数目较多时,MOST方法的效果较好[103]。......
2023-11-21
COPA方法是基于癌症组样本数据的第r分位数来确定差异基因表达值的。OS方法计算OS*i统计量,并且引入启发式规则附加表达值,利用分位数的知识对基因芯片数据进行基因表达的差异表达基因检测。在式中,差异表达基因的数量默认为个。COPA方法、OS方法、ORT方法和MOST方法的共同特点是以参数方法,采用样本基因表达强度的中值和中值绝对离差定义差异基因表达的统计量,都利用基因表达的分位数检测差异基因表达。......
2023-11-21
在COPA方法的基础上,Tibshirani等人在2007年提出的OS方法引入了分位数做启发式规则附加表达值,进行差异表达基因检测。由于差异估算中用正常组样本中值代替了全部数据的中值,ORT方法比COPA方法和OS方法恰当地估计了两组数据的差异。COPA方法和OS方法随差异数目的增加,性能有所降低。Lian在2008年提出的MOST方法隐性地考虑了差异基因表达强度临界值所有可能的取值,通过确定其统计量最大值来确定阈值,从而检测差异表达基因。......
2023-11-21
Tomlins等人在2005年提出了COPA方法,用于检测癌症组样本一小部分基因相对于正常组样本过表达的差异表达基因检测[101],许多学者由此受到启发,截至2010年9月13日,该文章的引用次数已经达到了763次。David A.Hanauer指出在不久的将来,COPA差异表达基因检测方法会提供较多的与癌症发生演化相关的重要基因,从而为揭开癌症的神秘面纱贡献力量[102]。通过模拟研究和应用到公共基因芯片数据,表明以上成果为综合分析和提高传统差异表达基因检测提供了方法。......
2023-11-21
在国外涉及较早的变点研究是突变点,对于渐变式变点的研究也有一些结论,对于位置参数模型提出了变点的最小二乘法的估计。最小二乘法就是以观察值和理论值之差的平方和作为目标函数,将其达到极小值的点作为有关参数的点估计[8]。给出衡量最小二乘法识别多差异表达基因检测突变点能力的方法,模拟研究最小二乘法对不同具有差异表达基因的基因表达谱数据生成过程的多差异表达基因变点检测效果[10]。......
2023-11-21
许多研究者对此进行了研究,并提出了多种差异表达基因检测方法。OPA方法采用基因组数据异常分析的非参数方法对某特定基因进行检测,这个基因的基因芯片数据的一个组中只有一部分样本相对于另一组样本过高表达,剩余的样本没有差异表达的迹象。PACK方法、PADGE方法、PPRM方法、OPA方法、LRS方法也研究了假定癌症组子集样本相对于正常组样本有过高或过低表达的差异基因表达检测统计方法。......
2023-11-21
实验二基因工程表达产物分离纯化1.实验目的熟悉大肠杆菌包涵体表达产物的分离纯化原理及工艺流程。①先复性再纯化以包涵体形式表达的产物经复性后,采用各种色谱柱技术进行进一步的分离纯化。大肠杆菌系统表达产物分离纯化的主要任务是高效获取高比活性的表达产物,去除宿主蛋白质、核酸、内毒素等主要杂质类型。......
2023-12-07
差异表达基因检测不仅具有统计学意义,而且具有生物学意义,在医学临床诊断、药物疗效判断、揭示疾病发生机制等方面都有重要的作用。在医学研究中,癌症差异表达基因检测就是一个重要的问题。差异表达基因检测统计方法的目的是识别由于实验环境变化而引起的表达水平改变的基因[43]。在基因芯片数据分析中,差异表达基因检测的传统方法通常是假定所有癌症组样本相对于正常组样本都具有过高或过低的表达。......
2023-11-21
相关推荐