前兩天,我看到一個(gè)新的“混合”全閃存陣列形態(tài)出現(xiàn)了,NVMe+SAS SSD。這是誰(shuí)干的?是Tegile。
大家都知道,Dell是第一個(gè)支持在全閃存陣列進(jìn)行分層的廠商,其可以根據(jù)SLC、MLC、TLC不同的介質(zhì)SSD做成不同的性能層。目前,SLC SSD應(yīng)該基本沒(méi)有公司在做了,MLC和TLC應(yīng)該是市場(chǎng)的主流,未來(lái)估計(jì)還有QLC,因此,這種分層應(yīng)該還有一些市場(chǎng)。
Tegile的思路和Dell有點(diǎn)不同,不是采用不同的顆粒的FLASH做不同的層,而是采用不同接口的SSD做不同的層。即NVMe SSD是高性能層,SAS接口SSD做大容量層,當(dāng)然,顆粒也可以不同。
目前其在IntelliFlash HD系列支持這種分層方式。
不過(guò)看規(guī)格,好像一個(gè)陣列也就支持4個(gè)NVMe SSD,感覺(jué)數(shù)量太少了一些。估計(jì)直接利用控制器上的PCIe插槽來(lái)支持的。
Tegile采用HGST的NVMe SSD和SAS SSD,從單盤(pán)特性來(lái)說(shuō),確實(shí)NVMe的性能和時(shí)延都要好很多。這兩種SSD應(yīng)該顆粒是一樣的,只是接口不同。
目前NVMe已經(jīng)走進(jìn)了主流存儲(chǔ)廠商的原生全閃存陣列產(chǎn)品里。比如,華為的Dorado 5000 V3,采用自研的NVMe SSD,是市場(chǎng)上第一款主流的NVMe SSD。
然后Pure Storage也推出了FlashArray //X70系列,也采用自研的NVMe 模塊,并且將在年底其前端支持也NVMeF,號(hào)稱第一款100%的NVMe陣列。
NVMe標(biāo)準(zhǔn)也在不斷演進(jìn)當(dāng)中,其中剛剛發(fā)布的NVMe 1.3標(biāo)準(zhǔn),針對(duì)數(shù)據(jù)中心,支持了三個(gè)重要的特性:數(shù)據(jù)擦除、多流寫(xiě)和虛擬化。
其他還有一些管理特性的增強(qiáng),還有針對(duì)消費(fèi)級(jí)的一些新特性。
由于我們重點(diǎn)講企業(yè)特性,因此,我這里重點(diǎn)和大家聊聊那三個(gè)數(shù)據(jù)中心特性。
第一個(gè)特性是數(shù)據(jù)擦除。我在今年的中國(guó)閃存峰會(huì)分享過(guò),現(xiàn)在SSD擦除比較麻煩,沒(méi)有標(biāo)準(zhǔn)。傳統(tǒng)的HDD有專門(mén)的擦除方法,比如很多企業(yè)內(nèi)部采用低級(jí)格式化的方式。新的NVMe 1.3規(guī)范定義了3種擦除方式,第一是塊擦除,采用物理刪除NAND塊這種低級(jí)塊刪除方式,有點(diǎn)類似HDD的低級(jí)格式化,應(yīng)該是采用專門(mén)的命令。第二種方式就是針對(duì)加密的SSD,直接修改秘鑰,這樣數(shù)據(jù)就不可再解密;第三種方式是覆蓋寫(xiě),但是由于SSD有FTL,因此這個(gè)覆蓋寫(xiě)應(yīng)該不是普通的覆蓋寫(xiě),而是可以直接寫(xiě)具體物理地址的覆蓋寫(xiě)。不過(guò),由于會(huì)影響壽命,因此不是推薦的擦除方式。
為什么需要這么費(fèi)勁做數(shù)據(jù)擦除,因?yàn)檫@樣可以防止數(shù)據(jù)泄密,而且這個(gè)SSD可以重新回收利用。在陣列退役或者SSD更換維修的時(shí)候,這個(gè)標(biāo)準(zhǔn)可以幫助你安全擦除數(shù)據(jù)。如果不能安全擦除,你可能需要購(gòu)買(mǎi)硬盤(pán)不返還維保服務(wù),價(jià)格要高一些。
第二個(gè)特性存儲(chǔ)虛擬化。這里的存儲(chǔ)虛擬化指的是虛擬機(jī)如何訪問(wèn)下面的NVMe SSD。傳統(tǒng)的方式是NVMe驅(qū)動(dòng)在Hypervisor里,所有VM都通過(guò)Hypervisor來(lái)訪問(wèn),這些性能會(huì)差些。
現(xiàn)在支持VM直接訪問(wèn)NVMe SSD,就好像其獨(dú)占這個(gè)NVMe SSD一樣。
目前實(shí)現(xiàn)的原理是采用PCIe SR-IOV技術(shù)。因?yàn)镹VMe SSD也是PCIe的接口,因此,就像原來(lái)直通網(wǎng)卡和直通顯卡一樣,采用SR-IOV來(lái)實(shí)現(xiàn)每個(gè)VM可以直接訪問(wèn)PCIe的設(shè)備。
第三個(gè)特性,我認(rèn)為也是最大的特性就是多流寫(xiě)了。大家知道,SSD上面有一個(gè)控制器(小腦),但和Host(大腦)一直沒(méi)有一種方式來(lái)交換元數(shù)據(jù),實(shí)現(xiàn)一種聯(lián)動(dòng)?,F(xiàn)在NVMe 1.3定義了一個(gè)交換元數(shù)據(jù)的方式,即在每個(gè)IO命令上可以加上一個(gè)標(biāo)簽。
在NVMe 1.3里面,這個(gè)交換元數(shù)據(jù)技術(shù)首先應(yīng)用在多流寫(xiě)技術(shù)里。大家知道,SAS SSD的多流寫(xiě)技術(shù)已經(jīng)由三星推動(dòng)成一個(gè)SCSI的標(biāo)準(zhǔn)(詳見(jiàn)用多流寫(xiě)技術(shù)提高SSD的性能和壽命?),但是,由于NVMe SSD拋棄了SCSI協(xié)議,因此,需要重新定義一個(gè)多流寫(xiě)的標(biāo)準(zhǔn)。
如果沒(méi)有多流寫(xiě),所有的負(fù)載都混在一起。
因此,SSD盤(pán)里的數(shù)據(jù)冷熱程度是無(wú)序的。這樣對(duì)于垃圾回收來(lái)說(shuō)特別不利。
有了多流寫(xiě)以后,SSD盤(pán)根據(jù)寫(xiě)入的I/O上面的標(biāo)簽,把不同標(biāo)簽的數(shù)據(jù)放到不同的區(qū)域(冷熱數(shù)據(jù)分區(qū)存放)。這樣垃圾回收的效率大大提高,SSD盤(pán)就能提供更好的性能,不受傳統(tǒng)的垃圾回收的困擾。
除了多流寫(xiě),未來(lái)也可以擴(kuò)展到其他的元數(shù)據(jù),比如I/O優(yōu)先級(jí)聯(lián)動(dòng)。從上面NVMe的路標(biāo)可以看到,2019年要提供IO Determinism(IO確定性)這個(gè)特性,應(yīng)該就是利用給I/O打上QoS標(biāo)簽的原理,把Host的I/O優(yōu)先級(jí)傳遞給NVMe SSD,讓SSD的控制器(小腦)優(yōu)先處理高優(yōu)先級(jí)的I/O。未來(lái)其他的存儲(chǔ)廠商也真的有可能采用商用的NMVe SSD來(lái)實(shí)現(xiàn)類似現(xiàn)在華為Dorado V3一樣的盤(pán)控聯(lián)動(dòng)功能了(詳見(jiàn)不做SSD盤(pán)/卡,可以實(shí)現(xiàn)華為Dorado V3的盤(pán)控聯(lián)動(dòng)技術(shù)嗎),不過(guò)就是要等到2019年才有機(jī)會(huì)實(shí)現(xiàn)相當(dāng)于目前華為Dorado V3的聯(lián)動(dòng)能力,而且目前看只有三星SSD在主推這個(gè)技術(shù),Intel SSD不一定跟進(jìn),因?yàn)檫@是一個(gè)可選的選型,不是所有的NVMe SSD都會(huì)支持。因此,可能限制你自由選擇SSD盤(pán)廠商,一般大廠是不愿意綁定一個(gè)SSD廠商的。
我們看到,隨著今年華為和Pure推出NVMe全閃存陣列,標(biāo)志著2017年進(jìn)入了NVMe AFA的元年。隨著NVMe規(guī)范的完善,估計(jì)2年后,幾乎所有的AFA廠商都會(huì)轉(zhuǎn)向NVMe。
NVMe的時(shí)代已經(jīng)到來(lái),讓我們現(xiàn)在就考慮采用NVMe吧。
分享到微信 ×
打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。