HP最新發(fā)布的高端存儲3PAR 20800系列,西瓜哥認(rèn)為其最大的改進(jìn)就是RPO了。
高端存儲由于對可靠性的追求,大部分都可以實現(xiàn)秒級的RPO(指異步復(fù)制),而原來3PAR 10000只能實現(xiàn)5分鐘的RPO(下面這個圖寫10分鐘,其實應(yīng)該可以做到5分鐘的)。
為什么異步復(fù)制的RPO如此重要,因為這是很多用戶認(rèn)為其是區(qū)別中高端的一個關(guān)鍵的區(qū)別指標(biāo)。加上HP 3PAR 20850是全閃存配置,這種情況下幾乎不會采用同步復(fù)制,因為這樣閃存的時延優(yōu)勢就體現(xiàn)不出來了,但用戶希望RPO越小越好,減少丟失的數(shù)據(jù)量。
這個HP管理界面的截圖,可以看出,如果同步復(fù)制,時延在1.5ms,但如果采用異步復(fù)制,時延小于0.5ms。
國外一個blogger參加了HP的大會,說HP宣傳其流復(fù)制(Async Streaming)可以做到RPO<1s,而EMC的SRDF/Async的RPO是15s,相差15倍。
但另外一個blogger提供的截圖,只是宣傳比SRDF/A的RPO低1/3而已,并沒有15倍的差距。
從HP官方的blogger的信息看,HP的流復(fù)制采取了其最新的ASIC+Cache隊列相結(jié)合的技術(shù)來實現(xiàn)。
解釋一下,就是主陣列的數(shù)據(jù)寫到Cache里,先不要落盤,這些變化的數(shù)據(jù)打上序號,嚴(yán)格保證寫順序。然后在用ASIC每隔100ms打一個包(dataset),這個包里面的寫順序是有保障的,也就是寫一致性是OK的。這些包放到傳輸隊列里,如果帶寬足夠,就會馬上傳輸?shù)竭h(yuǎn)端。
如果真是100ms打包一次,那么按照異步傳輸?shù)脑?,其RPO應(yīng)該最少是2個100ms,也就是200ms。因為當(dāng)鏈路故障的時候,正在傳輸?shù)膁ataset收到了影響,同時,主存儲正在準(zhǔn)備的下一個dataset也收到影響。因此,丟失的數(shù)據(jù)量就是2個dataset,也就是200ms。這個是在不考慮帶寬的情況下。
HP官方blogger說,采取這種技術(shù),每次dataset的數(shù)據(jù)量一般都是幾MB級別,比如下面的管理界面截圖,是11MB。這樣少的數(shù)據(jù)量,使得傳輸非常快,1s的RPO還真不是吹的。
但如果帶寬不夠,寫數(shù)據(jù)太多,cache滿了,來不及傳輸,HP目前的機(jī)制是自動切換到原來的周期復(fù)制方式。但HP說目前只能實現(xiàn)所有的RG(復(fù)制組)全部切換為周期復(fù)制的方式,不能選擇某些優(yōu)先級高的業(yè)務(wù)保留流復(fù)制的模式。據(jù)說下一個版本才能實現(xiàn)這個功能。
看到這里,是否你也認(rèn)為HP新高端可以做到小于1S的RPO呢?
實際使用情況下,西瓜哥認(rèn)為是不太現(xiàn)實的。如果是一般的應(yīng)用,這么宣傳是可以的,但如果是數(shù)據(jù)庫這類應(yīng)用,這個RPO是不現(xiàn)實的。
我們來一塊分析一下。假設(shè)是ORACLE數(shù)據(jù)庫的應(yīng)用,大家知道,ORACLE在主機(jī)是有cache機(jī)制的,如果要采用陣列的復(fù)制技術(shù),為了保證遠(yuǎn)端的副本可以直接拉起來,那么你是需要快照來保證一致性的。
HP的流復(fù)制,雖然采用ASIC來保證了寫的順序,但如果沒有主機(jī)快照代理,把ORACLE主機(jī)的臟數(shù)據(jù)刷到陣列里再做快照,那么遠(yuǎn)程的副本也可能是不能直接使用的。
我沒有從HP官方或者blogger的資料里面看到HP的流復(fù)制和快照的聯(lián)動(也沒有看到流模式是否可以做兩地三中心組網(wǎng))。我們假設(shè)HP 3PAR流復(fù)制支持快照聯(lián)動,由于數(shù)據(jù)庫的快照你不能打得太密,否則會影響數(shù)據(jù)庫的性能,因此,1-2s打一次快照,能夠?qū)崿F(xiàn)3-5s的RPO應(yīng)該是比較合理的。這個水平,其實高端存儲大家差距不是不大。
兩年前華為發(fā)布高端存儲Oceanstor 18000 V1的時候,就宣傳支持秒級RPO。其原理是采用基于Cache時間戳的異步復(fù)制技術(shù),數(shù)據(jù)寫入Cache的時候都帶有時間戳,因此打快照的時候,可以直接在Cache里完成,這樣就可以實現(xiàn)秒級的RPO,而且,這個快照可以和ORACLE主機(jī)的快照代理聯(lián)動,保證遠(yuǎn)端的數(shù)據(jù)是可以直接拉起來的。其實所有高端存儲能做到秒級RPO的,基本都是在Cache上做文章。
分析完3PAR的Streaming異步復(fù)制,我們來看看HP新高端的樣子。這個是主控柜,上面6個是磁盤框,下面那個大家伙就是3PAR 2K的控制框了。
這個控制框,感覺好像可以分為上下兩個,每個4個節(jié)點,一共8節(jié)點。8個節(jié)點后面通過無源背板連接在一起。由于沒有細(xì)節(jié)的圖片,不知道后面是兩個背板拼在一起,還是一個大背板。
每個節(jié)點就是一個控制器,里面有兩塊SATA SSD(sandisk的),上面保存OS(估計做鏡像)。有8個內(nèi)存插槽給數(shù)據(jù)cache使用(每插槽最大支持32GB),他們直接連接到2塊 ASIC(圖中右部兩個黑色塊)上。左邊帶大大散熱片的是兩個INTEL的CPU,連接6個內(nèi)存插槽作為控制cache(OS,元數(shù)據(jù)等),也是每個槽位 最大32GB。
大家可以看到,3PAR的cache設(shè)計和其他廠商不同,控制cache和數(shù)據(jù)cache是分開的。
據(jù)說HP正在準(zhǔn)備SPC-1和SPC-2測試,可能很快就會發(fā)布。從目前的跡象看,西瓜哥懷疑HP采用全閃存的方式,可能會超過HDS VSP G1000 200萬IOPS(宣傳320萬),奪下SPC-1的性能冠軍的寶座。華為據(jù)說要采用混合介質(zhì),要達(dá)到300萬SPC-1 IOPS,可能從絕對值來說,也許不是第一。具體HP和華為那家先發(fā)布SPC-1的值,到底誰能勝出,只能靠時間來驗證。從上市時間看,HP和華為基本都是在8月份開始出貨,加上HP國內(nèi)改姓紫光(H3C),大戰(zhàn)在所難免。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。