首页 百科知识基因表达分析技术-基于SAGE方法的实验成果

基因表达分析技术-基于SAGE方法的实验成果

【摘要】:实验十二基因表达的系列分析技术基因组是一个生命体遗传信息的总和。基因芯片技术和基因表达的系列分析为基因表达研究提供了高效的手段。由于SAGE技术的所具有的特点,使其受到广泛重视,并通过改进形成了多种SAGE方法。随着SAGE技术的日益成熟,在基因表达方面已经得到了广泛的使用。SAGE技术主要是基于以上原理,通过获得tag从而确定基因的表达情况。

实验十二 基因表达的系列分析(SAGE)技术

基因组是一个生命体遗传信息的总和。确定基因组DNA序列是揭示生命活动规律、探讨疾病发生机制的基础。人类基因组计划的完成为人类疾病的遗传学研究奠定了坚实的基础,并成为现代生物医学研究的一个重要的里程碑。但是在人类基因组中,基因的数目远远低于蛋白质的种类,这预示着基因表达及其表达产物的加工是更为复杂的过程。因此,转录组学(transcriptomics)和蛋白组学(proteomics)成为后基因组学时代的核心研究方向。转录组学和蛋白组学分别从mRNA和蛋白质两个层面上剖析基因的功能和调控机制。基因芯片技术和基因表达的系列分析(serialanalysis of gene expression,SAGE)为基因表达研究提供了高效的手段。

基因表达的系列分析(SAGE)是由Velculescu等建立并用以分析基因组表达的方法。与mRNA差异展示(mRNA differential display,DDRT)、抑制性消减杂交(suppression subtractive hybridization,SSH)、差异消减展示(differential subtraction display,DSD)及基因芯片等方法相比,SAGE可以在未知目的基因的前提下,分析来自一个细胞的全部转录本信息;对已知或未知基因表达进行定性和定量分析;具有假阳性率低、可重复性强等优点。

由于SAGE技术的所具有的特点,使其受到广泛重视,并通过改进形成了多种SAGE方法。1998年,Powell率先使用生物素标记PCR引物,PCR产物通过与携带亲和素的磁珠交联,而获得目的cDNA,从而增加了目的标签的产量以及效率。为了解决SAGE需要较大量RNA的问题,Datson等提出了MicroSAGE方法,通过优化mRNA提取过程、调整PCR反应循环步骤以及使用亲和素连接的PCR反应试管,使得分析的mRNA样品量减少到1~5ng,完全满足了SAGE技术在组织活检标本、微量组织细胞分析上应用的需要。其后,Ye等创造了miniSAGE技术,其技术特点是使用了mRNAcapture试剂盒,从而使mRNA分离以至cDNA标签的分离在一个试管中进行,减少了样品量的损失;减少了连接反应中连接子的量,从而降低了连接子对PCR扩增反应的干扰,提高双标签的产率;通过phaselock凝胶,以增加每次苯酚抽提后DNA回收率和纯度。随着SAGE技术的日益成熟,在基因表达方面已经得到了广泛的使用。

1.SAGE的原理

mRNA的3`末端特定部位存在可以标上其特异性的标签(tag),其长度一般在10~14个核苷酸之间,检测tag可以获得该mRNA的表达信息。SAGE技术主要是基于以上原理,通过获得tag从而确定基因的表达情况。其次,分离获得的tag可以通过串联连接克隆于载体上,以便测序,提高了分析效率。同时,根据同一tag重复次数,可以判断转录本的表达水平。

2.操作步骤

①提取RNA,并将其与携带生物素标记的oligodT混合,以mRNA为模板,经逆转录得到双链cDNA。

②锚定酶(anchoringenzyme,AE)酶切生物素标记的双链cDNA。锚定酶要求至少在每一种转录本上有一个酶切位点,一般4碱基限制性内切酶能达到这种要求。NiaⅢ是一种广泛的限制性内切酶,平均每250bp就存在一个NiaⅢ识别位点CATG,因此是理想的SAGE锚定酶。

③应用带有亲和素的磁珠分离生物素标记的cDNA3′端酶解片段,获得mRNApolyA尾部与最近的酶切位点之间的片段。

④将分离得到的cDNA酶切片段等分为A和B两部分,分别与设计好的两种连接子A或B连接。连接后的DNA片段在3′端包含有ⅡS型内切酶(如BsmFⅠ)的识别位点。

⑤用ⅡS型内切酶(又称标签酶)消化以上步骤获得的连接产物,并去除与磁珠相连的DNA片段。ⅡS型内切酶的作用方式以标签酶BsmFⅠ为例,BsmFⅠ的识别和切割位点为5′-GGGAC(N)10↓-3′/3′-CCCTG(N)14↓-5′,因此产生连有接头的短cDNA片段,长为10碱基,即释放的cDNA标签,不同的标签酶获得的碱基数不同,如FokI可以获得9碱基的标签。

⑥利用Klenow片段或T4DNA聚合酶消化产生的黏性末端,混合两个cDNA池的短cDNA片段,并连接成100bp的双标签(ditag)。

⑦以引物A和B通过PCR扩增双标签,扩增产物含有2个尾尾相接的标签(一个Ditag),其侧翼有锚定酶切割位点。

⑧利用锚定酶酶切扩增产物,分离纯化以收集标签(Ditag)。

⑨将每30~50个双标签连接起来,并克隆到pZErO-1载体中,建立SAGE文库。

⑩对插入到pZErO-1载体中的双标签序列进行测序,并利用相应的应用软件进行结果分析,确定原始序列中每个标签序列、数目以及发生率。同时可以与NCBI的SAGEmap、GenBank以及EST公众数据库进行比对,找出标签与基因及EST之间的对应关系,对标签进行定性。

3.SAGE技术的应用(www.chuimin.cn)

(1)全基因组转录图谱的建立

早在1995年,Velculescu等选择BsmFI和Nia分别作为标签酶和锚定酶对胰腺组织中1000多个标签进行手工测序,发现)5%以上的标签能够代表唯一的转录物。2001年,Caron等将公众SAGE数据库的231万标签以及他们自己从神经母细胞瘤分离到的16万个标签按照组织来源分成12组,并经过计算,将这12组不同组织的标签与已做染色体定位的基因进行比对,获得了可以反映基因表达丰度的全基因组转录图谱,并发现染色体上存在高表达的基因簇区域(region of increased gene expression,RIDGE)。结果提示,基因组结构是高度有序的,一个典型的RIDGE在1cR(centiary)的染色体长度上通常含有6~30个基因,而低转录区域仅含有1~2个基因,例如在18号染色体上,目前发现有385个表达丰度较低的基因,而在大小相近的19号染色体上分布着一连串RIDGE,包含了937个基因。

(2)在基因差异表达中的研究在生物的基因组中存在两大类基因:管家基因和奢侈基因。管家基因在不同组织来源的细胞中广泛表达,而奢侈基因的表达具有组织特异性。研究组织特异性基因的表达是揭示细胞分化的基础。SAGE技术为基因差异表达的研究提供了有效的手段,在发育生物学以及肿瘤生物学中得到了广泛的应用。

通过SAGE技术对病理状态和正常生理状态的组织进行基因表达谱比较研究,可以发现疾病相关的标记基因。Sun等通过对双向性精神病进行研究,发现5-羟色胺转运蛋白和转录因子NF-κB复合体组分基因高表达,此结果成为该病的重要指征。

(3)模式生物的研究SAGE技术已经广泛地应用于其他模式生物的研究中。Velculescue等在酵母上分离得到60633个SAGE标签,其中93%的标签可与4665个基因对应。Matsumura等从水稻秧苗中分离出10122个标签,其中23.1%可与已知的1367个cDNA、EST匹配。

4.SAGE数据库及其分析相关网站

(1)http://www.sagenet.org/sage_protocol.htm

(2)http://www.sagenet.org/SAGEDatabases/unigene.htm

(3)http://www.sagenet.org/SAGEData/sagedata.htm

(4)http://www.ncbi.nlm.nih.gov/SAGE/

(5)http://genome-www4.stanford.edu/cgi-bin/SGD/SAGE/querySAGE

(6)http://www.labonweb.com/

(7)http://www-dsv.cea.fr/thema/get/sade.html

(8)http://sciencepark.mdanderson.org/ggeg/

(9)http://www.urmc.rochester.edu/smd/crc/swindex.html

(10)http://www.genzyme.com/research/gzmo/discovery/discoveryplatforms2_sage_gzmo.asp