来自《自然》杂志的最新报道,欧洲生物信息学研究所的科学家以DNA为介质,创建了一种数据存储新技术,只需手掌般大小的人工合成DNA便可容纳全世界高达30亿TB的数据。
这一次,DNA尝试记录莎士比亚。那些曾直抵恋人心底的154首十四行诗,以一种令人意想不到的科学方式,被编写进生命的编码中。当然,739KB的DNA文档里,还包括一张照片、一篇PDF版本的科学论文、马丁·路德·金的演讲“我有一个梦想”的片段(长度为26秒)和压缩算法的text文本。
没有人会想到,新成果的发现源于研究所的预算捉襟见肘。三年前的一个晚上,研究所副所长埃文·比尔尼和同事尼克·戈德曼来到德国汉堡市的一家酒吧消遣。彼时,研究所负责管理包括DNA序列和蛋白质结构等数据在内的生物学信息数据库,存储量每年以几何指数增长,数据维护渐渐力不从心。
饮酒时的话题,多少总会与工作沾点边儿。用什么可以替代昂贵的存储硬盘和磁带?研究所如何才能更好地处理犹如海啸般袭来的数据?很自然地,两位生物学家扯到了DNA上。
不知道是谁开了一个玩笑:DNA将会是一个很好的选择!要知道它存储数据的历史相当悠久人类从长毛猛犸象骨骼中提取的DNA中获得了数万年前的信息。
来不及多想,他们在酒吧的餐巾纸上匆匆地记录着奇妙的创意。那些细节也被一一勾勒在了更多的餐巾纸上:就像计算技术中广泛采用的0和1二进制存储信息那样,用四个分子字母G、T、C、A来编码储存信息。
他们为数千个DNA片段拟定了蓝本,每个片段都包含有一份文档片段,并将这些设计寄给科技公司,用以合成所定制的DNA。你几乎无法想象,看起来,那些片段就像塑料管底部的一点点白色尘埃。
随后的两周,研究团队使用一台标准的DNA测序仪来打开这些文档。然后,再用戈德曼设计的软件将已测序DNA重新组装成前后连贯的可读文档。让他们惊奇的是,从白色尘埃中再现的文档几乎完全无损。在完成少许修复工作之后全部信息被恢复,其准确度达100%。
他们做了一个测算:以DNA的方式存储的一首莎士比亚十四行诗,重量只达0.3亿万分之一克。类比过来,1克DNA就可以存储一百多万张CD所拥有的信息量。理论上来说,这一技术可以用于存储3ZB的数据,这相当于目前世界上存在的所有的存储数据,并且安全存放多个世纪。
不过现在还不是丢弃硬盘的时候。目前的DNA存储技术充其量还处于初级阶段:一是不可重复写入。如果不重复整个合成程序就无法更新信息;二是不允许随意读取。比如,只有将全部文档解码,才能阅读存储文档中的每首莎士比亚十四行诗。
科学家们助长的生活想象,有时候也会引发担忧。有人会问,如果这种DNA找到了一种方式进入人或者动物的身体,会不会对人的健康造成伤害。戈德曼的回答已成竹在胸:我们创造的这种DNA不会突然渗入人的基因组,因为它使用的是活体细胞中一种完全不同的代码。如果这种DNA确实进入了人的身体,它也会自行退化和处理掉。
如此这般,那么,五十年后,你或许就可以这样留存记忆:用电子邮件把有价值的文件、相片和材料寄给DNA存储公司,一周或更短时间内,他们将寄回给你丁点大的DNA。你可以将其放置在冰箱中,或者埋藏于花园里。完全不用担心,成千上万年之后它们肯定会依然完好如初。