首页 理论教育DNA:时间刻印的信息宝库

DNA:时间刻印的信息宝库

【摘要】:不可思议的是,在大多数生物体的DNA中,竟然多数段落都是乱码。拿我们人类的DNA来看,有用的基因组只有22000个,总长度仅占DNA的3%,其余97%的区域都被“垃圾基因”占据。DNA不仅可以储存信息,而且信息衰减和损耗几乎为零。如今全球每年产生的数据需要4180亿个1TB的硬盘才能放下,而把这些数据储存在DNA上,仅仅需要1千克DNA物质。同时,DNA存储费用比较昂贵。

光子计算带来了算力的提升。但计算与储存如同好马配好鞍,两者相辅相成。计算速度与储存速度不匹配,就会遇到著名的冯·诺依曼瓶颈。那么,在数据爆炸的时代,储存技术又有哪些想象空间呢?

大家是否幻想过一个问题:假设人类文明被一场灾难摧毁,我们的知识和历史还能保留吗?纸张会腐烂,硬盘会降解,甚至连石头也会风化。但是,有一种物质可以无视这些物理过程,那就是DNA。

我们知道,组成DNA的基本单元是脱氧核苷,每个脱氧核苷都带有一个碱基,而碱基共有四种类型,分别是腺嘌呤、鸟嘌呤、胸腺嘧啶和胞嘧啶。如果用0、1、2、3各代表一个碱基,就可以组成一个四进制的存储方式。人类基因组包含大约相当于750MB的信息,这么多信息就储存在一条比细胞还小得多的DNA上,并且事无巨细地告诉我们的身体:鼻子该长在哪里,眼睛该长成什么颜色,某个蛋白又该怎么合成。

不可思议的是,在大多数生物体的DNA中,竟然多数段落都是乱码。拿我们人类的DNA来看,有用的基因组只有22000个,总长度仅占DNA的3%,其余97%的区域都被“垃圾基因”占据。这些垃圾基因其实是曾经与生命活动有关但后来失效的基因,因此无论对这些基因怎样改动,都不会对生命活动造成影响。

于是科学家想,既然DNA上的乱码区可以随意填写,那何不填写上我们需要保存的信息呢?

2000年,美国生物学家把一段信息“刻”进了细菌的体内,这段信息就是爱因斯坦著名的质能方程“E=mc2”。2003年,又有人把迪士尼动画片中的一段曲子“刻”进了细菌体内。到了2010年,当首个人造细胞诞生时,领导该项工作的美国基因学家卡耐基·文特尔又把所有参与该项目的科学家的名字“刻”进了人造细胞的DNA上。

DNA不仅可以储存信息,而且信息衰减和损耗几乎为零。2019年,据《连线》杂志报道,科学家通过一种含有DNA数据的材料,用3D打印的方式制造出一只塑料兔子。神奇的是,即使切下这只塑料兔子的尾巴,也可以在尾巴的DNA信息中制造出一只一模一样的塑料兔子。

这正是因为DNA存储可以提供大量的信息密度和超常的半衰期。

如今全球每年产生的数据需要4180亿个1TB的硬盘才能放下,而把这些数据储存在DNA上,仅仅需要1千克DNA物质。不仅如此,依靠生物碱基不同的排列方式,这些信息还可以在-18℃的环境储存100万年之久。

虽然DNA存储可以应对数据爆炸,但离真正商用还非常遥远。特别是数据的读写速度还非常慢,比如仅仅5MB的数据,读写就需要花费4天时间。同时,DNA存储费用比较昂贵。但是,随着生物技术的发展,DNA存储费用已经呈现大幅下降趋势,就拿基因测序的费用来说,2012年的费用仅是2001年的百万分之一。