首页 理论教育基因组大小:物种复杂性与基因组大小无对应关系

基因组大小:物种复杂性与基因组大小无对应关系

【摘要】:如果咱们玩斗地主,78910JQK,这个序列是有意义的,在扑克牌里叫顺子,在基因组里可类比于一个基因。现在你明白了吧,说一个物种基因组有多大,就是问这个物种有多少张“扑克牌”,也即多少个碱基对。460Mb,也就是4.6亿对;大豆的基因组有多大啊?1Gb,大约是10亿对;那小麦的基因组呢?你可能有点儿混乱了,难道不是物种越高等,基因组就越大么?物种的基因组大小和它的复杂性之间没有严格的对应关系,这个现象被称为“C值悖论”。

当我们遇到一个新的物种,随着知识背景的不同而愈发专业,大概会从“这是什么动物”“这动物是肉食还是植食”,一直问到“这动物是哪个科的”。至于“这货能吃么”,不在本次讨论之列。

当我们从基因角度去研究一个物种的时候,一定会问一个问题:“这个物种基因组有多大?”第一次看到这个名词一定会有些奇怪,基因就是基因,基因组又是个什么东西呢?这东西还能用大小描述么?

为了便于理解,我们用扑克牌举例。一副牌不算大小王是52张,花色是黑、红、梅、方;一个人的基因组有30亿个碱基对(3Gb),花色是A、G、T、C(A腺嘌呤、G鸟嘌呤、T胸腺嘧啶、C胞嘧啶),都是DNA的基本组成部分。如果咱们玩斗地主,78910JQK,这个序列是有意义的,在扑克牌里叫顺子,在基因组里可类比于一个基因。但如果这个顺子里面的10变成了9,那么这个本来可以一次出去的牌,就变成了只有一对9,其他都是单牌,这副牌玩下去可能就输了。这样的变化就属于基因突变,如果发生在重要的基因上,可能就会引起遗传疾病或者肿瘤

这个地球上相当比例的生物都是二倍体,即由受精卵发育而来,且每一个体细胞内都有两套染色体,分别来自父母。人类也是如此。但我们讲基因组的时候通常说的是其中的一半,即单倍体。我们可以把一个人的基因组想象成一副有30亿张牌的扑克,分成了23摞,每一摞就是一条染色体,所以一个人是有23对染色体的(22对常染色体和1对性染色体),又因为性染色体有X、Y两种,所以人类总共有24种染色体。我们人类大约有22000个基因(准确的数字今天依然有争议),但也只占到了全部序列的1.5%,其他清楚功能的算在一起也不过3%。也就是说,我们基因组当中至少还有97%是“暗物质”,越来越多的证据表明这些之前认为的“垃圾序列”是有用的,只是我们还没有研究得很明白。(www.chuimin.cn)

现在你明白了吧,说一个物种基因组有多大,就是问这个物种有多少张“扑克牌”,也即多少个碱基对。比如乙型肝炎病毒基因组有多大啊?3.2Kb,也就是3200对;大肠杆菌基因组有多大啊?4.6Mb,也就是400多万对;果蝇(一种蝇类)的基因组有多大啊?137Mb,也就是1.37亿对;水稻的基因组有多大啊?460Mb,也就是4.6亿对;大豆的基因组有多大啊?1Gb,大约是10亿对;那小麦的基因组呢?16Gb,也就是160亿对。至于人类,刚才已经讲过了,大约是3Gb,也就是30亿个碱基对。不光是人类,大部分哺乳动物也都是在3Gb左右,而鸟类的基因组大部分是1Gb左右,至于鱼类、两爬类还有昆虫们,它们的基因组大小范围就非常广阔了,从几百Mb到几十Gb都有,还真不容易一概而论。

你可能有点儿混乱了,难道不是物种越高等,基因组就越大么?当然不是,正如不能说鲸鱼、大象比人体型大,它们就比人类更高等一样。物种的基因组大小和它的复杂性之间没有严格的对应关系,这个现象被称为“C值悖论”。