人民網
人民網>>四川頻道>>綜合欄目>>社會

信息存到DNA 細菌變身移動硬盤?

北大團隊:使用的是非致病細菌 存儲數據效率是傳統硬盤的1000萬倍

2023年02月20日09:12 | 來源:北京青年報
小字號

原標題:信息存到DNA 細菌變身移動硬盤?

  近日,北京大學定量生物中心錢瓏/歐陽頎團隊在國際知名學術刊物《尖端科學》上發布的一篇論文引發了網友熱議,論文中稱研究人員將一篇容量約5KB文章存儲到了細菌的DNA中,從而將細菌變成了“移動硬盤”。

  為何選擇細菌作為信息的載體?是否會存在生物安全風險?日前,北京青年報記者聯系到該論文的其中一位通訊作者錢瓏,她表示,DNA數據儲存技術已有多年的發展歷史,但此次是國內首次利用細菌來承載儲存數據的DNA。研究人員此次使用的是一種不會導致疾病的細菌,再加上其他的技術手段,可以確保實驗對人類的安全性。

  如何變身“移動硬盤”?

  將字符串記錄在DNA鹼基對上

  北京大學官方網站顯示,上述論文的兩名通訊作者中,歐陽頎為中國科學院院士、北京大學物理學院講座教授、北京大學定量生物學中心副主任。另一名通訊作者錢瓏為北京大學定量生物學中心助理研究員。

  錢瓏介紹說,DNA是生物體正常運作必不可少的一類物質,存在於各種生命體的細胞之中。如果不作改造,DNA攜帶的是生命延續和生物運作必需的遺傳信息。從結構上講,DNA像條鏈子一樣,是由鹼基對組成的序列,每一個位置上都有四種可能性,像“結繩記事”那樣由前到后記錄了遺傳信息。DNA這條鏈子越長,承載的信息就越多。

  在計算機領域,無論漢字、英文還是數字符號,抑或是一張圖像、一支音樂或一部電影,它在計算機中保存時,都可以按照全球通用的編譯規則轉化為“1”和“0”兩種數字的字符串。這個轉化的過程稱為“編碼”。硬盤裡儲存著大量這樣由“1”和“0”組成的字符串。在打開圖片或文檔時,計算機要執行讀取數據的過程,“1”和“0”的字符串又要經過“解碼”,呈現為感官接觸的圖片、文字或音樂等。而DNA數字存儲,就是把原本記錄在計算機硬盤上的“1”和“0”的字符串,改為記錄在DNA的鹼基對上,不同的鹼基對應不同的字符串。

  這樣,我們人類可讀的信息就轉化成DNA的序列。在需要讀取數據時,就從試管中提取出DNA分子,對DNA的序列進行讀取,“解碼”為平時使用的數據。

  信息如何讀取?

  所用儀器比手機還小

  錢瓏表示,在DNA數據存儲方面,科研人員已經努力了10年左右。在過去十年,主流的DNA數據存儲方式是“DNA池”:把DNA分子做成溶液保存在試管裡,這就可以稱為一個DNA池。一個DNA分子能承載200比特左右的信息,而一支小小的試管裡,能保存大量的DNA分子。估計下來,一毫升的DNA溶液裡可以保存的數據相當於2000多個2TB移動硬盤的內容。但這種“DNA池”的存儲方式也有弊端。讀取這些DNA時需要專用的儀器,普通家庭一定不會購置。所以,“DNA池”中信息的讀取需要專業設備和技術,不能像手機裡的數據那樣即寫即讀。因此,這種“DNA池”模式適用於比較大的數據庫或數據中心,但無法滿足少量、頻繁、日常的數據存儲。

  “我們現在是把數據保存在細菌的DNA裡,然后對細菌進行培養。”錢瓏介紹,細菌是一個生命系統,細胞中的各類結構相互協調,能夠維持DNA結構的穩定存在,一個DNA鏈就能變得更長,能存儲更多信息。所以,一個DNA分子上就能承載更多的信息,比如這次就是把大約5KB的信息儲存在了細菌的DNA裡。

  傳統的模式在信息讀寫方面都需要比較大的專業儀器,這是因為它們的數據是由大量短鏈片段組成的,相比之下細菌的DNA鏈條更長,就可以用更小巧的測序儀進行解讀,其大小比手機還小,需要的時候取出一點細菌液,經過簡單處理就可以讀取出數據。

  “細菌作為一種生物,還可以通過自我復制進行增殖,我們可以直接利用細菌自身的繁殖能力,讓承載著信息的DNA隨著細菌的增殖而復制。細菌自己不斷復制的同時,我們的信息就能不斷保留下去。”錢瓏說。

  是否存在安全風險?

  使用的是非致病細菌

  有網友擔心,在編輯細菌的DNA用來保存信息的時候,是否會產生對人有傷害的“超級細菌”?對此,錢瓏表示,生物安全是全社會非常關心的問題。“我們在編碼的時候會使用算法,並且和全世界的基因庫進行對比,保証這一段信息之中不會出現與生物本身的編碼基因相同的片段。這就意味著,我們用於編碼信息的DNA不太可能表達出任何生物體本身的性狀。也就是說,我們導入的信息對於細菌來說是沒有任何意義的,其意義只是能承載人類才能讀取的信息。可以說,我們編輯的信息幾乎不會干擾細菌本身的生理特性和生物功能。這是我們最基本的要求。”

  錢瓏說,“未來在技術上我們還可以在細菌的DNA裡添加一些基因,確保細菌離開特定環境的時候就會自行死亡。類似這樣學界公認的生物安全操作手段,可以被應用到這個系統裡。我們使用的細菌是一種在極端環境的鹽湖裡找到的微生物,並不是能夠導致疾病的細菌。這種細菌在人類生活的環境下生長比較緩慢,這使得它的營養會很快被別的細菌奪走,難以繼續生存。總之,這個實驗是非常安全的。”

  DNA存儲數據有何優勢?

  存儲效率是傳統硬盤的1000萬倍

  錢瓏表示,DNA的存儲密度特別高。以硬盤存儲為例,它的精度是納米級別,但幾納米的尺度上隻能記錄一個“1”或一個“0”。此外,傳統的硬盤、光盤等存儲設備不是百分百的結構都用來存儲數據,它還要散熱結構等來擠佔空間﹔與之相比,DNA存儲的密度在理論上可以是傳統的硬盤存儲效率的1000萬倍。

  DNA的保存時間比較長。例如一些化石中提取出的DNA,雖然已經成為碎片,但通過一些技術手段,仍然能夠提供大量的信息。它的壽命遠遠超過現在的存儲介質,有的硬盤放置十幾年,可能就無法讀取數據了,它的硬件是會隨著時間損耗的。相比之下,DNA的保存時間是非常長的。

  DNA的存儲和讀取不需要什麼能量。雖然合成DNA和為DNA測序的過程需要特定裝置耗電,但如果只是長期保存,可以直接在常溫環境下保存,連冰箱冷藏都不需要。所以它的保存幾乎是沒有能耗的。現在的數據庫、數據中心都要用硬盤存儲數據,這些硬盤是需要通電保持的﹔而且它平時也會放熱,需要降溫裝置,降溫也需要很大的能耗。

  此外,DNA的體積低。DNA是一個納米級的分子,比如大醫院的病例數據,如果專門建造一個數據庫進行儲存,它的資金消耗可能是千萬元到億元級別,需要一個大型空間和專業設施來承載硬盤及其他存儲設施。但一屋子的硬盤存儲的數據,用DNA來儲存可能就是手裡的一捧試管。“這個對比就是很明顯的。基於這種考慮,科學家開始思考用DNA作為存儲數據的工具。”錢瓏介紹。

  對話

  北青報:為什麼要用DNA這種生命體內的遺傳物質來存儲數據?

  錢瓏:我們正身處一個大數據時代,也許普通人會覺得自己手中的數據沒有多少,但在整個社會中,數據的積累已經到了很大的程度。一個U盤可以承載幾個GB的文件。日常使用的存儲介質中容量最大的可能就是硬盤,有的硬盤存儲容量能達到1個TB,相當於1024個GB。

  但社會上採集的各類數據要大得多,比如,一個天文台每天產生的數據是以PB為單位的,一個PB的文件量就能裝滿1024個容量為1TB的移動硬盤了。這樣日復一日積累下去,就是一個名副其實的“天文數字”。許多數據現在雖然採集了,但長年用不上,只是需要存檔,不能刪除。現在我們的解決方法是將這些數據存放在數據中心,但數據中心需要耗電維護,降低數據丟失的風險。這種情況下一年消耗的電量是極大的。

  另外,現在我們的硬盤使用的材料主要由硅元素構成。但是,地球上每年能開採的硅資源是有限的,無法承擔未來海量數據的存儲。所以,我們要為未來尋找資源再生的、密度高的、存放時間長的新型材料。

  北青報:儲存在細菌DNA裡的5KB信息包含了什麼內容?

  錢瓏:我們導入的數據是弗朗西斯·克裡克和詹姆斯·沃森在1953年發表的DNA雙螺旋結構論文,這篇論文首次揭示了DNA的雙螺旋結構,在這一研究領域具有巨大的歷史意義。論文轉成數據以后有5KB大小。將這篇有劃時代意義的論文保存在細菌裡的想法是我們團隊的歐陽頎教授提出的。

  北青報:這項技術多久能走進普通人的日常生活?

  錢瓏:應該說,現在我們存儲和讀取DNA中的數據所需要的成本還比較高,但隨著技術的進步,這些成本很可能會逐漸降下來。

  未來,如果DNA成為重要的數據介質,DNA池存儲和細菌基因組存儲兩種方式各有不同的特性,兩者可以互補。它們之間就像大數據中心和普通人手中的U盤,用途不同、形式也不同。未來一段時間,像細菌基因組存儲這樣的便攜式、功能性存儲系統或許會是重點發展的方向。當然,這樣一個技術路線的打通需要每個節點的進步,也就意味著需要全球各個學科領域的科研工作者共同努力。

  北京青年報記者 屈暢 實習生 侯翔宇

(責編:彭茜、高紅霞)

分享讓更多人看到

返回頂部