北京时间7月8日午间消息,微软本周宣布,利用DNA存储技术完成了约200MB数据的保存,其中包括《战争与和平》,以及99部经典文学作品。此前已有研究人员证明,数据可以被保存在DNA之中。不过微软表示,此前并没有任何研究者能一次性向DNA写入如此多数据。
微软该项目首席研究员卡林·施特劳斯(Karin Strauss)表示,DNA是一种优良的存储介质。相对于传统存储技术,DNA存储能带来更高的存储密度。华盛顿大学也参与了这一研究项目。目前,这项技术成本昂贵,操作复杂。不过,微软希望借力生物科技行业的研究成果。由于生物技术的进步,近期DNA读写工具的成本正在下降。DNA被认为是磁带的替代选择,后者是目前用于长期存储的标准介质。
施特劳斯表示:“微软希望看看,我们能否开发出基于DNA的端到端系统去保存信息。这样的系统将是自动化的,并且可用于企业。”她表示,微软开展这一项目的动机在于,当前的电子存储设备发展速度赶不上数据量的增长。“如果你关注当前的项目,那么可以看到,我们无法在期望的成本内保存所有信息。”
IDC预计,到明年,全球范围内保存的数字化数据将达到16万亿GB,其中大部分位于大型数据中心。施特劳斯估计,一个鞋盒那么多的DNA就足以保存100个大型数据中心的数据。
管底粉红色物质即DNA,少量DNA即可存储大量数据
DNA也有着很好的耐久性,尤其是在干燥寒冷的情况下。今年3月,有研究人员宣布,已部分重建了古人类基因。这些古人类的骨骼保存在西班牙一处洞穴里已有超过40万年历史。作为对比,磁带保存数据只有几十年时间,随后就会老化。
将数据保存在DNA之中需要将0和1数据转换为4种核苷酸,即碱基组成的序列。2012年,哈佛大学分子生物学家乔治·切奇(George Church)向DNA中写入了一本5万个单词、数据量不到1MB的书,随后将其印刷在比花粉粒还小的玻璃芯片上。今年,切奇又报告称,已实现了22MB数据的DNA编码。
微软此次则宣布,已成功向数百万DNA写入了10倍于此前的数据量。每个DNA包括150个碱基。
加州大学伯克利分校博士后研究员雷因哈德·赫科尔(Reinhard Heckel)也在研究利用DNA去存储数据。他表示,微软的成功令人关注。不过,阻碍DNA存储技术大规模使用的障碍主要是成本,因为制作订制的DNA分子成本高昂。“如果希望人们接受这一技术,那么你需要这项技术的成本低于磁带。这很难。”
微软并未披露此次DNA数据存储项目耗费的成本,这其中用到了约15亿个碱基。负责合成这些DNA的Twist Bioscience通常每碱基价格为10美分。商用合成技术的成本最低可以达到每碱基0.04美分。读取100万碱基的成本约为1美分。
施特劳斯相信,读写DNA的成本未来几年将会大幅下降。她表示,已有证据表明,这一成本的下降比过去50年中晶体管制造成本降低的降速更快,而晶体管成本的下降是计算技术创新的动力。
2007年,对人类基因组的测序耗资约1000万美元,但到2015年这一成本已下降至1000美元。(维金)