地球与环境 2022-07-03 14:24

想象一下在DNA链上演奏巴赫的《第一大提琴组曲》。

这种情况并不是不可能发生的。由于DNA太小,无法承受有节奏的敲击或滑动的弓弦,它是存储音频文件和各种其他媒体的强大工具。

“DNA是大自然原始的数据存储系统。我们可以用它来存储任何类型的数据:图像、视频、音乐——任何东西,”贝克曼先进科学技术研究所的研究员、该研究的合著者Kasra Tabatabaei说。

扩大DNA的分子构成和开发一种精确的新测序方法,使多机构团队能够将双螺旋结构转变为一个强大的、可持续的数据存储平台。

该团队的论文发表在2022年2月的《纳米快报》上。

在数字信息时代,任何有勇气浏览每日新闻的人都会感到全球档案的分量与日俱增。越来越多的纸质文件被数字化,以节省空间和保护信息免受自然灾害的影响。

从科学家到社交媒体影响者,任何需要存储信息的人都能从一个安全、可持续的数据锁盒中受益——而双螺旋结构恰好符合这一要求。

伊利诺伊大学香槟分校(University of Illinois Urbana-Champaign)的研究生、这项研究的合著者潘超(Chao Pan)说:“DNA是存储档案数据的最佳选择之一,如果不是最好的选择的话。”

DNA的寿命只有耐久性能与之匹敌,它的设计能够经受住地球最严酷的条件——有时长达数万年——并且仍然是一个可行的数据来源。科学家可以对化石链进行排序,以揭示基因历史,并为消失已久的景观注入生命。

尽管DNA身材娇小,但它有点像《神秘博士》中臭名昭著的警察包厢:内部比表面看起来要大。

“每天,互联网上产生数pb的数据。只需要一克DNA就足以存储这些数据。这就是DNA作为存储介质的密度,”Tabatabaei说,他也是一名五年级的博士生。

DNA的另一个重要方面是它的自然丰富性和近乎无限的可再生性,这是当今市场上最先进的数据存储系统所不具备的特点:硅微芯片,它们通常只流通几十年,然后就被随意掩埋在一堆垃圾填埋的电子垃圾中。

“在我们面临前所未有的气候挑战之际,可持续存储技术的重要性再怎么高估也不为过。新的,绿色的DNA记录技术正在出现,这将使分子存储在未来变得更加重要,”Olgica Milenkovic说,他是富兰克林W. Woeltge电气和计算机工程教授,也是这项研究的合作pi。

在展望数据存储的未来时,这个跨学科的团队研究了DNA的千年MO。然后,研究人员加入了他们自己的21世纪变体。

在自然界中,每条DNA链都含有四种化学物质——腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶——通常以首字母A、G、C和t表示。它们沿着双螺旋排列、重新排列,形成科学家可以解码或排序的组合,以产生意义。

研究人员在现有的四个碱基序列上增加了7个合成碱基,从而扩大了DNA已经广泛的信息存储能力。

“想象一下英语字母表。如果你只有四个字母,你只能创造这么多单词。如果你有完整的字母表,你可以产生无限的单词组合。这和DNA是一样的。我们可以将0和1转换为A、G、C和T,而不是将0和1转换为A、G、C、T和存储字母表中的七个新字母。”

因为这个团队是第一个使用化学修饰的核苷酸在DNA中存储信息的团队,成员们围绕一个独特的挑战进行创新:不是所有目前的技术都能够解释化学修饰的DNA链。为了解决这个问题,他们将机器学习和人工智能相结合,开发了一种首创的DNA序列读出处理方法。

他们的溶液可以区分改性的化学物质和天然的化学物质,并将七个新分子彼此区分开来。

“我们尝试了这11个核苷酸的77种不同组合,我们的方法能够完美地区分它们每一个,”潘说。“作为我们识别不同核苷酸方法的一部分,深度学习框架是通用的,这使得我们的方法可以推广到许多其他应用。”

这个字母完美的翻译来自于纳米孔:中间有一个开口的蛋白质,DNA链可以轻易通过。值得注意的是,该团队发现纳米孔可以检测和区分DNA链上的每个单体单元——无论这些单元是自然起源还是化学起源。

“这项工作提供了一个令人兴奋的原理证明演示,将大分子数据存储扩展到非自然化学,这有可能大幅增加非传统存储媒体的存储密度,”查尔斯施罗德说,材料科学与工程詹姆斯经济教授和该研究的合作pi。

DNA通过储存基因信息创造了历史。从这项研究来看,数据存储的未来也将是双螺旋的。

伊利诺伊大学香槟分校的其他合作者包括生物物理与数量生物学中心的Aleksei Aksimentiev;以及Roy J. Carver生物技术中心的Alvaro Hernandez。合作机构包括马萨诸塞大学阿默斯特分校和斯坦福大学。有关合作者及其附属机构的完整列表,请参阅已出版的作品。

参考:

S. Kasra Tabatabaei, Bach Pham, Chao Pan, Jingqian Liu, Shubham Chandak, Spencer A. Shorkey, Alvaro G. Hernandez, Aleksei Aksimentiev, Min Chen, Charles M. Schroeder, Olgica Milenkovic。扩展DNA-ba的分子字母表 具有神经网络纳米孔读出处理的sed数据存储系统。纳米快报,2022;DOI: 10.1021 / acs.nanolett.1c04203


推荐阅读:迪拜房产