昨天我們聊了富士通高端存儲有一個fast recovery特性,其實原理很簡單的。傳統(tǒng)的RAID組重構(gòu)慢,主要原因是采用了單獨的熱備盤,重構(gòu)的時候,這塊熱備盤的寫性能是有限的,因此瓶頸在這塊熱備盤的寫性能上。
而富士通fast recovery的改進就是取消了傳統(tǒng)的熱備盤,RAID組里面的每個硬盤都保留一部分熱備空間,當(dāng)一塊硬盤失效,所有的硬盤都可以寫,也就是把單獨熱備盤的寫瓶頸問題給解決了。
當(dāng)然,這樣做就必須對硬盤進行切片(CK),就像切西瓜一樣(西瓜哥就是用切西瓜的方式來闡述RAID 2.0原理才被網(wǎng)友稱為西瓜哥的)。因此,RAID的構(gòu)建單位也是CK,而不是硬盤。這樣的好處就是可以只重構(gòu)有數(shù)據(jù)的CK,而不需要整個硬盤的CK都進行重構(gòu)。
昨天就有網(wǎng)友講了,這不就是RAID5EE嗎?確實很像,但是富士通為了加快重構(gòu)速度,不只是在一個RAID組里面實現(xiàn),因為硬盤數(shù)太少,重構(gòu)的速度不夠快。富士通把多個RAID組再組合起來,組成一個bigger(逼格)的大RAID組,加快重構(gòu)的速度。
咦,如果這樣,那么不是RAID 2.0了嗎?確實也很像,但仔細一看不太一樣,因為RAID 2.0是全局塊虛擬化了,不是一個bigger的RAID組,而是整個硬盤池。而且,RAID 2.0沒有一個數(shù)據(jù)回拷的過程,而富士通的fast recovery更換故障盤后,數(shù)據(jù)需要回拷,這個時間也是很長的,因為這個時候,這個新盤的寫入就是瓶頸點。
富士通的這種實現(xiàn),感覺好像不如RAID 2.0,但有一個好處,就是可以繼續(xù)支持磁盤休眠,因為其fast recovery還是一個比較小的池(bigger raid group),可以針對這個pool進行休眠。而RAID 2.0是全局的,無法實現(xiàn)硬盤休眠。富士通的高端存儲也是唯一具有休眠特性的高端存儲。雖然高端存儲跑的一般是關(guān)鍵業(yè)務(wù),全天候運行,但確實也有部分業(yè)務(wù)可能只需要白天工作,如股票市場。這種情況下休眠還是有一些節(jié)能的作用的。
原理雖然簡單,但今天我們重點看看富士通RAID6-FR的具體實現(xiàn)和性能表現(xiàn)。
從富士通的技術(shù)白皮書,我們看到,由于重構(gòu)池變大,為了可靠性的原因,富士通只實現(xiàn)了RAID 6的變種。這個思路有點像EMC XtremIO,Moshe Yanai研發(fā)的第三代高端Infinibox,都是只支持雙盤失效一種情況。因此,少了華為RAID 2.0的靈活性。不過,需要其他RAID級別,富士通還保留傳統(tǒng)的RAID方式。
我們看到,這個bigger的RAID組,最少包含2個小的RAID組,最大高達6個。這樣就可以讓整個重構(gòu)池的硬盤數(shù)量更多,重構(gòu)的數(shù)據(jù)就更快。(上面最后一行西瓜哥沒有看懂,就是RAID組里面用戶盤的個數(shù)應(yīng)該是18,這么是24?這個盤的個數(shù)是一個容量的概念,不是一個物理的概念,因為都切成CK了。)
至于重構(gòu)的相對速度,富士通給出的數(shù)據(jù)還是非常令人驚訝的。假設(shè)傳統(tǒng)的RAID6(3D+2P)在沒有主機負載情況下是1.0,作為基準(zhǔn)線。如果正常有業(yè)務(wù)跑,那么重構(gòu)速度就是0.5。我們看到,沒有主機負載情況下,RAID6-FR最快可以做到比正常的快48倍,有負載可以做到快26.6倍。華為宣傳RAID 2.0比傳統(tǒng)的RAID快20倍,看來富士通也可以做到。因為華為為了可靠性,人為設(shè)置了一個重構(gòu)域(64個盤),限制了參與重構(gòu)的磁盤數(shù)量。
不同的RAID實現(xiàn),容量使用率不同,保護級別也不同。用戶可以根據(jù)自己需求選擇。
富士通還針對各種RAID級別,采用不同的硬盤,對重構(gòu)性能進行了測試。這個數(shù)據(jù)更能說明問題,我們沒有看到其他廠商公布這么詳細的測試對比。
從下圖我們看到,在主機幾乎沒有負載的情況下,這個時候重構(gòu)速度最快。我們看到,采用傳統(tǒng)的方式,不管是何種RAID級別,重構(gòu)速度只和硬盤類型有關(guān)。因為傳統(tǒng)的RAID方式,重構(gòu)的瓶頸在于熱備盤的寫入速度。300GB/15krpm的重構(gòu)時間只有大約30分鐘,而4TB/7.2krpm的重構(gòu)時間需要9個多小時。但如果采用RAID6-FR,4TB硬盤的重構(gòu)時間最快也只需要10分鐘。
如果是主機有正常負載的情況,傳統(tǒng)的RAID方式和RAID6-FR的重構(gòu)時間都增長,因為陣列需要處理業(yè)務(wù),一般重構(gòu)的優(yōu)先級會設(shè)置比較低。這個數(shù)據(jù)屬于比較接近用戶現(xiàn)場的數(shù)據(jù)。我們看到,4TB SATA盤采用傳統(tǒng)方式重構(gòu)需要18個半小時,而采用RAID6-FR最快只需要37分鐘。
雖然富士通宣傳1TB磁盤的快速重構(gòu)時間是90分鐘,但這個測試結(jié)果明顯優(yōu)于富士通的宣傳??磥砀皇客ㄐ麄鬟€需要更適合中國國情,從上表看,完全可以宣傳4TB 10分鐘(理想值)。這樣重構(gòu)性能基本就可以和Infinibox持平了(其重構(gòu)域是480塊盤)。
富士通RAID6-FR重構(gòu)速度這么快,西瓜哥分析其CK肯定非常細??赡芎虸nfinibox一樣,直接采用4K,也就是條帶的寬度。華為是64M,3PAR是1G,越大理論上重構(gòu)越慢。
還有一個疑問就是不知道上面測試的時候硬盤的數(shù)據(jù)量是多少?因為快速重構(gòu)可以只重構(gòu)寫過的CK,因此數(shù)據(jù)量少的時候,重構(gòu)就更快。這塊華為宣傳的30分鐘是指1TB的數(shù)據(jù)量,和盤的容量無關(guān)。而富士通宣傳是1TB的硬盤。
關(guān)于富士通的RAID6-FR,我們認為還是一個不錯的改進,其優(yōu)點有:
1、保留傳統(tǒng)的RAID組特性,可以支持休眠,支持跨磁盤框保護;
2、可以和傳統(tǒng)的RAID組混用;
3、對系統(tǒng)的改造比較小,實現(xiàn)簡單。
缺點當(dāng)然也有,比如:
1、靈活性不夠,只支持RAID 6;
2、故障盤更換后數(shù)據(jù)需要回拷,耗時很長;
而華為的RAID 2.0+,則是完全把底層架構(gòu)推翻,全新的架構(gòu),開發(fā)難度比較大。但靈活性更高,沒有回拷過程,可以實現(xiàn)數(shù)據(jù)自動均衡,對應(yīng)用的性能支撐更好,因為一個卷可以跨越所有的硬盤。但也有不好的地方,就是不再支持傳統(tǒng)的RAID方式,而且無法也無法實現(xiàn)硬盤休眠。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。