首頁 新聞 > 研究 > 正文

將全世界信息保存到百萬年后,存儲在哪里?

起源于幾千年前的中華“陰陽”思想,被應(yīng)用于今天的生物學(xué)技術(shù)領(lǐng)域,并可能逐步改變未來的大數(shù)據(jù)產(chǎn)業(yè)發(fā)展。這或許是中國科學(xué)家才能碰撞出的“科技+文化”火花。

4月25日,《自然-計(jì)算科學(xué)》(Nature Computational Science)發(fā)表華大研究成果,研究團(tuán)隊(duì)開創(chuàng)了一套獨(dú)具優(yōu)勢的“陰陽”編解碼系統(tǒng),用以解決當(dāng)前DNA信息存儲領(lǐng)域的技術(shù)難題。

所有信息在計(jì)算機(jī)中只由二進(jìn)制的方式存儲,即0和1兩個(gè)數(shù)碼;

生物的遺傳信息則儲存在DNA中,以A、T、G、C四種堿基表現(xiàn)。

如果屏幕前的你是一位家長,在孩子學(xué)會(huì)這兩個(gè)知識點(diǎn)之后,或許可以引導(dǎo)他們思考:

倘若把信息語言的0和1,轉(zhuǎn)換為生物語言的ATGC,我們是不是就能把各類信息長久地保存在DNA中,讓DNA成為“完美”的存儲器了?

擅于把腦洞變?yōu)楝F(xiàn)實(shí)的科學(xué)家,已經(jīng)用實(shí)際研究成果對這個(gè)問題給出了樂觀的回答。

DNA憑什么碾壓現(xiàn)有信息存儲器?

我們正處在前所未有的信息大爆炸時(shí)代,據(jù)估算,2025年全球每天將產(chǎn)生491EB數(shù)據(jù)(1EB=1024PB,1PB=1024TB),相當(dāng)于每天制造出2億張DVD光盤。

隨著5G技術(shù)、大數(shù)據(jù)、人工智能等領(lǐng)域的蓬勃發(fā)展,海量數(shù)據(jù)如何長期穩(wěn)定存儲已成為亟待解決的一大難題,而以“BT+IT”融合的DNA信息存儲技術(shù),或能為這個(gè)問題提供更優(yōu)解,因此受到了越來越多的關(guān)注。

畢竟在存儲信息這件事上,DNA可以說是坐擁數(shù)十億年經(jīng)驗(yàn)的資深前輩。相較于現(xiàn)有的U盤、硬盤、磁帶等介質(zhì),DNA具備無法比擬的優(yōu)勢:

其一,超高的信息密度:2012年《科學(xué)》雜志文章指出,1克DNA理論上可以存儲455EB數(shù)據(jù),相當(dāng)于數(shù)千萬個(gè)1TB移動(dòng)硬盤的大小;

其二,超長的待機(jī)時(shí)間:DNA作為相對穩(wěn)定的分子,其半衰期長達(dá)521年,在理想狀態(tài)下甚至可保存成千上萬年;

其三,超強(qiáng)的生物兼容性:DNA作為絕大多數(shù)生物遺傳信息的載體,相對無機(jī)物、金屬等存儲介質(zhì)而言,具有更強(qiáng)的生物兼容性。

2019年,“DNA數(shù)據(jù)存儲器”入選《時(shí)代周刊》年度100項(xiàng)最佳發(fā)明。我們有理由相信,DNA憑借其獨(dú)家天然優(yōu)勢,在信息密度、復(fù)制與維護(hù)成本、使用壽命等方面都具有顛覆現(xiàn)有技術(shù)的巨大潛能。

研究10年,科學(xué)家們還有什么煩惱?

2012年開始,科學(xué)家們不斷進(jìn)行DNA信息存儲的相關(guān)嘗試。由于必須考慮與當(dāng)下合成測序技術(shù)的兼容性以及成本問題,前期DNA所能存儲的信息密度都較低。于是,科學(xué)家們聚焦于如何提升存儲的信息密度,也關(guān)注于生物技術(shù)兼容性問題,但仍不全面。

一直到2017年,科學(xué)家引進(jìn)信息通信領(lǐng)域的編碼方法——噴泉碼,以條件過濾的方式篩選DNA序列,唯有滿足篩選條件方可進(jìn)行最終生成,基于此實(shí)現(xiàn)了對生物技術(shù)的兼容。

盡管DNA噴泉碼的誕生幾乎解決了此前的技術(shù)瓶頸,但實(shí)際應(yīng)用中也出現(xiàn)靈活性與適用性的問題。

一方面,噴泉碼技術(shù)的建立是基于通信技術(shù)領(lǐng)域的原理基礎(chǔ),對原始數(shù)據(jù)類型偏好較強(qiáng)(如需要01分布相對均勻等),因此面向生物與信息融合新興領(lǐng)域的DNA存儲技術(shù)應(yīng)用,存在一定的局限性。另一方面,通信領(lǐng)域的信號傳輸是即時(shí)的、可及時(shí)糾錯(cuò)的,而生物領(lǐng)域的DNA分子存儲是異步異時(shí)的,一旦發(fā)生部分信息丟失或錯(cuò)誤,便存在原有信息無法恢復(fù)的風(fēng)險(xiǎn)。

如何在保證信息轉(zhuǎn)換效率和技術(shù)兼容的同時(shí),大幅提高信息恢復(fù)的穩(wěn)定性?毋庸置疑,技術(shù)需要進(jìn)一步發(fā)展。

以中華“陰陽”思想,解DNA存儲難題

面對DNA存儲中編解碼系統(tǒng)存在的棘手問題,深圳華大生命科學(xué)研究院(以下簡稱“華大研究院”)提供了全新的解決思路。中國科學(xué)家讓人驚喜的地方,在于能夠把我們引以為豪的古代哲學(xué)思想,融會(huì)貫通應(yīng)用到現(xiàn)代生物學(xué)之中,并期待以之解決未來世界的難題。

4月25日,華大研究院、深圳國家基因庫等多家機(jī)構(gòu)的研究團(tuán)隊(duì)聯(lián)合在《自然》(Nature)子刊《自然-計(jì)算科學(xué)》發(fā)表研究論文。研究團(tuán)隊(duì)結(jié)合DNA雙鏈模型,從中華文化中“陰陽”對立統(tǒng)一的思想獲得靈感,開創(chuàng)了一套名為“陰陽”的比特-堿基編解碼系統(tǒng),驗(yàn)證了該系統(tǒng)在信息密度、技術(shù)兼容性、數(shù)據(jù)恢復(fù)穩(wěn)定性等多方面的優(yōu)勢。

陰陽哲理博大精深,其特點(diǎn)可簡單概括為統(tǒng)一、對立和互化。研究院團(tuán)隊(duì)將其巧妙應(yīng)用到DNA編解碼系統(tǒng)當(dāng)中,以兩套不同的規(guī)則,分別對兩條二進(jìn)制信息進(jìn)行“一對一”編譯轉(zhuǎn)換,再取兩者統(tǒng)一交集的部分為最終解,實(shí)現(xiàn)將兩條獨(dú)立的信息組合統(tǒng)一為一串DNA序列。

機(jī)智的朋友可能會(huì)問,人工合成的DNA要保存在哪?目前,常用的保存方法分為體內(nèi)和體外兩種模式,兩者孰優(yōu)孰劣尚未形成明確定論。為了全方位驗(yàn)證“陰陽”系統(tǒng)的信息恢復(fù)穩(wěn)定性,華大研究院團(tuán)隊(duì)通過體外DNA干粉和細(xì)胞體內(nèi)大片段兩種存儲環(huán)境進(jìn)行測試,皆實(shí)現(xiàn)了原始存儲數(shù)據(jù)的完整恢復(fù)。

體外模式,研究團(tuán)隊(duì)采用不同濃度的原始DNA文庫溶液進(jìn)行了共200多組測試。結(jié)果證明,“陰陽”編碼采用的線性數(shù)據(jù)恢復(fù)模式在每種DNA分子的平均拷貝數(shù)僅有100時(shí),仍然能恢復(fù)最高88%的原始數(shù)據(jù)。而DNA噴泉碼使用的編碼方式使得每個(gè)數(shù)據(jù)包間存在一定的拓?fù)潢P(guān)聯(lián),在同樣條件下,平均恢復(fù)率僅有1.3%。

另一方面,研究將信息存在了酵母活細(xì)胞的體內(nèi),酵母菌株經(jīng)過1000代以上傳代之后,信息仍可以被完美恢復(fù)。這在一定程度上意味著,利用活體細(xì)胞作為DNA存儲的載體,上千年后原始信息或仍能被解讀。這樣的存儲方式可以得到接近于天然DNA分子存儲理論極限的物理信息密度,每克DNA能存儲的信息量約為432.2 EB。

華大研究團(tuán)隊(duì)曾將《開國大典》影片存儲于DNA中

從起步至今短短十年時(shí)間,DNA信息存儲領(lǐng)域已取得不少令人矚目的研究成果,包括檢索、修改等高級功能也已完成原理驗(yàn)證性的測試,以微軟、谷歌等產(chǎn)業(yè)巨頭形成的DNA存儲聯(lián)盟更是在為其商業(yè)化廣泛合作蓄勢。

在探索DNA信息存儲的同時(shí),華大也在DNA合成、DNA測序的設(shè)備與技術(shù)自主研發(fā)道路上持續(xù)深耕?;谌A大的MPS合成技術(shù)和DNBSEQ測序技術(shù),結(jié)合本研究的比特-堿基編解碼技術(shù),華大已經(jīng)實(shí)現(xiàn)了DNA存儲的全流程技術(shù)閉環(huán)。相信隨著華大等全球科研機(jī)構(gòu)、數(shù)字信息產(chǎn)業(yè)界的不斷突破,在不遠(yuǎn)的未來,“DNA硬盤”將成為我們?nèi)粘I钪斜夭豢缮俚臄?shù)據(jù)存儲設(shè)備之一。

該研究由深圳華大生命科學(xué)研究院主導(dǎo),深圳國家基因庫、首都師范大學(xué)、美國哈佛大學(xué)等多個(gè)研究團(tuán)隊(duì)共同參與。華大研究院平質(zhì)博士為論文第一作者,華大研究院沈玥研究員、徐訊研究員與哈佛大學(xué)George M. Church教授為論文的共同通訊作者。

該研究受到國家重點(diǎn)研發(fā)計(jì)劃、國家青年科學(xué)基金、廣東省高通量基因組測序與合成編輯應(yīng)用重點(diǎn)實(shí)驗(yàn)室、深圳合成生物學(xué)創(chuàng)新研究院等項(xiàng)目支持。本研究已通過倫理審查,嚴(yán)格遵循相應(yīng)法規(guī)和倫理準(zhǔn)則。

(文中圖片由華大研究院提供)

關(guān)鍵詞: 信息密度 信息存儲 科學(xué)家們 研究成果 遺傳信息

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2018 創(chuàng)投網(wǎng) - www.mallikadua.com All rights reserved
聯(lián)系我們:33 92 950@qq.com
豫ICP備2020035879號-12