DNA硬盘让数据存储无极限存储与灾备
50年前,在仙童半导体公司任职的摩尔提出了著名的“摩尔定律”,指引了21世纪的一场伟大科技革命。在这50年间,人类获取、处理信息的能力,遵循着摩尔定律冲破天际,但随之而来的一个问题也摆在了人类面前:这么多信息,我们该如何进行存储?
事实上,这个问题自现代计算机诞生以来便如鲠在喉。如今的教科书,更愿意把相关的解决方法统称为“存储技术”。在计算技术腾飞的这几十年,存储技术一直是一个疲惫的追赶者——其首要原因便是物理限制。与中央处理器(CPU)的硅片介质不同,现代的数据存储一般以磁介质为核心。顾名思义,就是要通过磁介质磁场行为的“记忆效应”来实现数据存储的功能。这种存储模式无论在尺寸上(数据密度)还是在使用寿命上(保存时间)都大打折扣。我们现如今使用的机械硬盘、固态硬盘、USB闪存等,其预期寿命都在十年左右,而且个头还不小,一旦数据丢失,造成的损失便无法弥补,维护的成本自然也相当高昂。
近年来,一些存储技术专家把目光投向了仿生学。他们论证道:生命是如此精细和复杂,为了能够无误地繁衍遗传,哪怕是一条蚯蚓,它所携带的信息也足以写满一屋子硬盘。蚯蚓的小身躯到底如何存储这些数据呢?答案便是DNA(脱氧核糖核酸)。DNA是遗传和基因编码的基本结构,其功能主要是半保留复制(延续生命)以及转录核糖核酸从而合成蛋白质(实现生命功能)。相比较磁介质存储的“傻大憨粗寿命不长”,DNA存储信息的能力极强——一汤匙DNA所携带的信息,可以存储自人类文明出现以来所有的书籍影音;且由于它特殊的双螺旋紧密结构,物理化学特性稳定,不易被破坏,低温下可保存千百年不变质。困扰存储技术多年的问题答案,早就被“造物主”写在了我们每个人的身体里。
DNA由四种含氮碱基——A、T、C和G互补配对构成,科学家将数据编码成二进制的数字串,每遇到一个0,就在目标DNA的尾巴上合成一个A—T碱基对;如果是1,就合成一个C—G碱基对。这样一来,整部莎士比亚全集就可以被存储在头发丝大小的“DNA硬盘”中。每次写完数据,就把“DNA硬盘”放到低温环境中保存。需要读取数据的时候,只需对目标DNA进行测序,将碱基对还原成二进制编码,再完成解码工作,就可以被人类“阅读”了。
当然,以目前的技术来看,“DNA硬盘”还有很多挑战要突破,比如存储(合成)成本太高、读取(测序)速度较慢。但是,利用DNA来存储数据的确是存储技术的一个光明的发展方向。随着仿生学的不断进步,用微如发丝的“DNA硬盘”存储记录人类文明的珍贵信息,将不再是一个久远的梦想。