首页 理论教育前瞻性研究成果及大菱鲆遗传育种工作

前瞻性研究成果及大菱鲆遗传育种工作

【摘要】:表9分型成功的7个SNP位点信息及基因注释信息图12小片段法基因分析部分结果2.4大菱鲆转录组高通量测序工作基于当前大菱鲆遗传育种工作的深入开展,需要筛选出大量的分子标记,构建高密度遗传连锁图谱,从而根据重要的经济性状,进行QTL定位,实现传统育种与分子辅助育种技术的结合;并开展与选育性状相关的功能基因研究。

重点开展了鲆鲽类非线性选择的基础技术理论研究,完成了非线性选择育种技术路线的制订;继续开展耐高温品系的选育、大菱鲆SNP分子标记辅助育种和大菱鲆转录组高通量测序等方面的研究工作。

2.1 鲆鲽类非线性选择的基础技术理论研究

基于一般系统论微分动力学原理,利用典型非线性生长模型,继续开展了鲆鲽类非线性选择的基础技术理论研究。依据前期所推导出的非线性选择育种的技术原理和理论依据,结合生物育种学和数量遗传学,完成了非线性选择育种技术路线的制订,为在家系选育过程中利用非线性选择技术进行良种选育,提供了良好的实用技术支撑。

2.2 耐高温品系的选育

(1)耐高温Sma-USC27标记在不同群体中的验证。利用微卫星分子标记辅助育种技术从选育一代家系中筛查到一个与温度显著相关的微卫星位点Sma-USC27,在其他家系中验证,结果一致;2013年,在选育二代家系时对不同系代群体进行验证,结果完全吻合,相关系数达到0.383(P<0.01),将考虑进行QTL定位。选育一代与选育二代的群体中的验证结果相同,说明与之关联的基因是稳定存在于鱼体中的,耐高温组中有1/4的个体具有该位点,不耐高温组不存在该位点,推测耐高温性状是由微效多基因控制的,符合数量遗传的特质(图10、图11)。

图10 2008年对2008年家系耐高温标记筛选

图11 2013年对2011年家系耐高温标记验证

(2)利用115对SSR引物进行了耐高温标记筛选。对2011年家系中的5号家系进行耐高温筛选试验;随机抽取存活个体30尾作为耐高温组N;按死亡先后顺序取最先死亡的个体30尾作为不耐高温组U。所得60个样本-20℃冷冻保存,以备用于微卫星分析。用从西班牙挑选的20对,本实验室开发设计出的相应的95对引物,按照优化后PCR条件对60个大菱鲆个体进行PCR扩增,分析有差异的等位基因片段在个体上具体的扩增情况(表8)。共计5对引物具有较显著的差异性。对微卫星位点所扩增出的差异等位基因片段与大菱鲆生长性状进行皮尔逊检验,判断有差异的等位基因片段与大菱鲆耐高温性状的相关性。

表8 微卫星位点与大菱鲆耐高温性状的相关性分析

结果(表8)有1个微卫星位点M044 153bp的等位基因片段与大菱鲆耐高温性状存在一定的负相关性;有4个微卫星位点Sma-USC38、M326、M049、M280分别在107bp、110 bp、134bp、246bp的等位基因片段与大菱鲆耐高温性状存在正相关性,其中位点M326 110 bp及M049 134bp的等位基因片段与耐高温性状的正相关性极显著,相关系数分别达到0.009和0.009(P<0.01),其余3个位点为一般显著性相关。

(3)耐高温传代选育家系的构建。依据遗传评定结果和耐高温相关的分子标记制订传代选育配种方案,成功构建耐高温传代选育全同胞家系22个,并构建对照系4个。在耐高温选育家系构建时,对于耐高温分子标记的应用,从2010年家系中挑选140尾亲鱼,对筛选出的USC-27,M326,M049三个分子标记基因分型验证,获得各自的对应带型。其中,USC-27耐高温标记为B带具有差异性,2012年实验中,为C带具有差异性,没有B带,在方案设计上结合两种情况进行配种。M12326,是D代具有差异性;M12049,C带具有差异性。从挑选出的140尾亲鱼,约32尾性腺发育,其中20尾参与了家系的育种工作。综合遗传评定和分子标记制订的配种方案,共计构建成功22个家系,对照系4个。

2.3 继续开展大菱鲆SNP分子标记辅助育种研究

对转录组获得EST-SNP筛选与相关性分析进行了研究。对本实验室通过高通量测序手段构建的大菱鲆雌雄转录组数据分析,获得4 000个EST-SNP,在参与细胞分裂、能量转换和细胞骨架等代谢过程的功能基因中,挑选出具有EST功能标签,雌雄差别20倍以上的SNP位点作为候选,共有24个位点,其中有6个多位点基因。进行小片段法设计引物。针对每个位点设计引物32对,要求PCR产物长度在50~100bp,能扩增出单一目的片段的引物有19条,成功率为60%,可以确定为假阳性的SNP位点有3个,假阳性率为12.5%;能成功进行基因分型的位点共有7个,其中6个为碱基替换型位点,即G-A占1个,C-T占2个,C-A占2个,G-T占1个,1个为碱基颠换型位点,即C-G占1个。图12为部分位点小片段法基因分型分析结果。对7个SNP位点的不同基因型和耐高温性能关联分析,结果位点S22与耐高温性呈显著相关,相关性系数达到0.42,(P<0.01),CC型大菱鲆在耐高温性上显著高于CG型。并且此位点存在于一种ATP合成酶组分,与能量代谢相关,接下来进行测序验证,该基因的全长cDNA克隆(表9)。

表9 分型成功的7个SNP位点信息及基因注释信息

图12 小片段法基因分析部分结果

2.4 大菱鲆转录组高通量测序工作(www.chuimin.cn)

基于当前大菱鲆遗传育种工作的深入开展,需要筛选出大量的分子标记(SSR,SNP),构建高密度遗传连锁图谱,从而根据重要的经济性状,进行QTL定位,实现传统育种与分子辅助育种技术的结合;并开展与选育性状相关的功能基因研究。因此本实验室以构图群体的父母本各自的多组织(肝、脾、肾、脑、肌肉、性腺)为混合样本,得到了父本、母本的多组织混合RNA,采用Solexa high-seq2000高通量测序平台进行测序、拼装及统计,通过数据库比对,注释进Unigene的功能,筛选差异表达基因(differentially expressed genes,DEGs),开展DEGs的GO和Pathway富集分析,筛查简单重复序列(simple sequence repeat,SSR)和单核苷酸多态性(single nucleotide polymorphism,SNP)。目前该项目已经验收,大菱鲆转录组数据统计和分析工作业已完成。

经Illumina测序平台,分别在大菱鲆父本和母本多组织样本cDNA文库中测得23万余和21万余条平均长度为100bp的reads;通过trinity软件拼接组装得到106 643个contig,去冗余后得到71 107个平均长度为892bp的contig;其中,通过生物学软件预测出蛋白序列的contig有65 535个,包括11 485个已注释基因和54 050个假定蛋白(表10)。在大菱鲆基因组信息尚未公布的情况下,这些contig为开展该物种分子生物学相关研究提供了基础序列。

表10 Solexa测定的大菱鲆父本和母本转录组数据

利用RPKM法(Reads Per Kb per Million reads)严格筛选大菱鲆父母本转录组的差异表达基因DEGs。如图13所示,相对于大菱鲆母本,在父本多组织混合的转录组中有2 317个基因的表达显著上调,9 214个基因的表达显著下调。这些DEGs在大菱鲆基因组公布后必然会得到更确切的注释,届时从中筛选与生长发育等生理过程相关的差异基因和分子标记,为大菱鲆遗传创质与改良工程提供基础数据。

图13 大菱鲆父母本转录组表达差异显著基因统计

注:q-value<0.001且log2(Fold change)normalized>1为上调基因;q-value<0.001且log2(Fold change)normalized<-1为下调基因。

Gene Ontology(简称GO)是一个国际标准化的基因功能分类体系,通过一套动态更新的标准词汇表来全面描述生物体中基因和基因产物的属性。GO共有三个ontology,分别用来描述基因的分子功能(molecular function)、所处的细胞位置(cellular component)和参与的生物过程(biological process)。GO功能显著性富集分析能够显示在差异表达基因中显著富集的GO功能条目(GO term),并揭示与差异表达基因显著相关的生物学功能。利用GoPipe程序对大菱鲆父母本转录组进行GO分析,发现共有16 540个预测蛋白匹配7 317 项GO terms。对DEGs的GO富集发现,在“cellular component”中“cell”term占主导,“intracellular”、“nucleus”等4项terms显著富集DEGs;在“molecular function”中“binding”占主导,“catalytic activity”、“oxidoreductase activity”等8项terms显著富集DEGs;在“biological process”中“cellular process”占主导,“biosynthesis”、“macromolecule metabolism”等5项terms显著富集DEGs(图14)。通过对大菱鲆父母本转录组参与代谢通路的差异表达基因进行超几何分布统计,发现37条代谢通路中的差异基因被显著富集(表11)。通过分析大菱鲆父母本差异表达基因的GO和Pathway富集情况,明确了某些代谢通路和参与其中的基因,为以后开展相关研究打下基础。

图14 大菱鲆父本相对于母本转录组差异表达基因(DEGs)的GO富集分析

注:*表示FDR≤0.01显著富集差异表达基因(DEGs)的GO term。

表11 大菱鲆父本相对于母本转录组显著富集差异表达基因的信号通路

(续表)

注:FDR≤0.01的Pathway定义为在差异表达基因中显著富集的Pathway。

采用SciRoKoCo的misa条件在大菱鲆父母本转录组中寻找简单重复序列(simple sequence repeat,SSR),共找到36 474处,其中4 251处可以设计引物。这些SSR极大地丰富了大菱鲆微卫星数据库,为大菱鲆遗传连锁图谱的构建提供充足、有应用潜力的分子标记。

岗位专家 马爱军)