北京時(shí)間7月8日午間消息,微軟本周宣布,利用DNA存儲(chǔ)技術(shù)完成了約200MB數(shù)據(jù)的保存,其中包括《戰(zhàn)爭(zhēng)與和平》,以及99部經(jīng)典文學(xué)作品。
此前已有研究人員證明,數(shù)據(jù)可以被保存在DNA之中。不過(guò)微軟表示,此前并沒有任何研究者能一次性向DNA寫入如此多數(shù)據(jù)。
微軟該項(xiàng)目首席研究員卡林·施特勞斯(Karin Strauss)表示,DNA是一種優(yōu)良的存儲(chǔ)介質(zhì)。相對(duì)于傳統(tǒng)存儲(chǔ)技術(shù),DNA存儲(chǔ)能帶來(lái)更高的存儲(chǔ)密度。華盛頓大學(xué)也參與了這一研究項(xiàng)目。目前,這項(xiàng)技術(shù)成本昂貴,操作復(fù)雜。不過(guò),微軟希望借力生物科技行業(yè)的研究成果。由于生物技術(shù)的進(jìn)步,近期DNA讀寫工具的成本正在下降。DNA被認(rèn)為是磁帶的替代選擇,后者是目前用于長(zhǎng)期存儲(chǔ)的標(biāo)準(zhǔn)介質(zhì)。
施特勞斯表示:“微軟希望看看,我們能否開發(fā)出基于DNA的端到端系統(tǒng)去保存信息。這樣的系統(tǒng)將是自動(dòng)化的,并且可用于企業(yè)。”她表示,微軟開展這一項(xiàng)目的動(dòng)機(jī)在于,當(dāng)前的電子存儲(chǔ)設(shè)備發(fā)展速度趕不上數(shù)據(jù)量的增長(zhǎng)。“如果你關(guān)注當(dāng)前的項(xiàng)目,那么可以看到,我們無(wú)法在期望的成本內(nèi)保存所有信息。”
IDC預(yù)計(jì),到明年,全球范圍內(nèi)保存的數(shù)字化數(shù)據(jù)將達(dá)到16萬(wàn)億GB,其中大部分位于大型數(shù)據(jù)中心。施特勞斯估計(jì),一個(gè)鞋盒那么多的DNA就足以保存100個(gè)大型數(shù)據(jù)中心的數(shù)據(jù)。
管底粉紅色物質(zhì)即DNA,少量DNA即可存儲(chǔ)大量數(shù)據(jù)
DNA也有著很好的耐久性,尤其是在干燥寒冷的情況下。今年3月,有研究人員宣布,已部分重建了古人類基因。這些古人類的骨骼保存在西班牙一處洞穴里已有超過(guò)40萬(wàn)年歷史。作為對(duì)比,磁帶保存數(shù)據(jù)只有幾十年時(shí)間,隨后就會(huì)老化。
將數(shù)據(jù)保存在DNA之中需要將0和1數(shù)據(jù)轉(zhuǎn)換為4種核苷酸,即堿基組成的序列。2012年,哈佛大學(xué)分子生物學(xué)家喬治·切奇(George Church)向DNA中寫入了一本5萬(wàn)個(gè)單詞、數(shù)據(jù)量不到1MB的書,隨后將其印刷在比花粉粒還小的玻璃芯片上。今年,切奇又報(bào)告稱,已實(shí)現(xiàn)了22MB數(shù)據(jù)的DNA編碼。
微軟此次則宣布,已成功向數(shù)百萬(wàn)DNA寫入了10倍于此前的數(shù)據(jù)量。每個(gè)DNA包括150個(gè)堿基。
加州大學(xué)伯克利分校博士后研究員雷因哈德·赫科爾(Reinhard Heckel)也在研究利用DNA去存儲(chǔ)數(shù)據(jù)。他表示,微軟的成功令人關(guān)注。不過(guò),阻礙DNA存儲(chǔ)技術(shù)大規(guī)模使用的障礙主要是成本,因?yàn)橹谱饔喼频腄NA分子成本高昂。“如果希望人們接受這一技術(shù),那么你需要這項(xiàng)技術(shù)的成本低于磁帶。這很難。”
微軟并未披露此次DNA數(shù)據(jù)存儲(chǔ)項(xiàng)目耗費(fèi)的成本,這其中用到了約15億個(gè)堿基。負(fù)責(zé)合成這些DNA的Twist Bioscience通常每堿基價(jià)格為10美分。商用合成技術(shù)的成本最低可以達(dá)到每堿基0.04美分。讀取100萬(wàn)堿基的成本約為1美分。
施特勞斯相信,讀寫DNA的成本未來(lái)幾年將會(huì)大幅下降。她表示,已有證據(jù)表明,這一成本的下降比過(guò)去50年中晶體管制造成本降低的降速更快,而晶體管成本的下降是計(jì)算技術(shù)創(chuàng)新的動(dòng)力。
2007年,對(duì)人類基因組的測(cè)序耗資約1000萬(wàn)美元,但到2015年這一成本已下降至1000美元。