7月1日,黨的生日,中國股市下跌的日子。富士通也在那天向全球發(fā)布了其高端存儲第三代領導集體ETERNUS DX8000 S3。
其最大的領導DX8900 S3最令人驚訝的參數(shù)是最大支持24控,為目前所有的高端之最。EMC VMAX3,HDS VSP G1000,包括一向以硬件規(guī)格自豪的華為OceanStor 18000 V3都是16控。一向低調的日系廠商,終于也高調了一回。至于400萬隨機IOPS,其實在24控的情況下,絕對值雖然最高,但平均到每一控也不算高。因此倒是沒有令西瓜哥太驚訝。
至于供貨時間,這個月底這兩個產品就可以供貨,但大于8控的DX8900 S3,供貨時間推遲到11月底了。
富士通S3如何做到24控?其架構比S2到底有哪些改進,又有哪些trade-off(取舍)呢?
其實,架構最大的變化就是從緊耦合轉向了松耦合。如果大家熟悉EMC VMAX的架構,一眼就看懂了富士通的DX8000 S3架構。幾乎是一模一樣的,只是EMC采用兩臺Infiniband交換機,而富士通采用了4臺PCIe交接機。也就是說,每個控制框是一個2控的類中端存儲,每個類中端存儲有自己的CPU、內存和接口卡和硬盤框。12個類中端存儲通過四個交換機連接起來,就是富士通的新架構——四星架構(Quad Star Architecture)。
對比DX8700 S2的架構,我們發(fā)現(xiàn),最大的變化就是后端路由器BRT沒有了。
沒有了BRT,也就是沒有了后端的全連接。系統(tǒng)的可靠性下降。因為不是所有的控制框都看到所有的控制器了,如果同一個控制框里面的兩個控制器都失效,系統(tǒng)將不可用。
但是采用和VMAX一樣的松耦合架構以后,擴展性更好了,這也是為什么富士通直接可以做到24控的原因。
由于富士通采用PCIe的交換機,西瓜哥記得Avago剛剛不久前才發(fā)布了25端口的PCIe交換芯片,這個芯片就可以用來制作24口PCIe交換機(其中有一個端口做管理用)。不知道富士通采用誰家的芯片?我們看到其到11月底才能交付8控以上的版本,不知道是否也是等24口的芯片量產?
而EMC VMAX采用Infiniband,市場上100口的交換機都有,應該是EMC認為目前高端存儲16控完全夠用了,因此沒有拉高這個參數(shù)。
而華為OceanStor 18000 V3也是采用PCIe交換機,指標也是緊跟EMC,保持在16控。但華為的控制框采用4控緊耦合的方式,可靠性上克服了原來雙控控制框出現(xiàn)一個控制器故障時引起的性能下降(因為要關閉寫cache),減低故障期間再出現(xiàn)故障就會造成系統(tǒng)不可用的風險。因為一般大城市上門時間都需要4小時,如果偏遠地方時間會更長。
而HDS VSP G1000,每個控制框是8個控制器緊耦合,可靠性又高了一些。但這種設計,擴展起來不太方便,目前支持2個控制框通過PCIe連接在一起,也是最大16控。
至于為什么富士通采用4個交換機而不是兩個,西瓜哥認為主要考慮帶寬的影響。因為S3的架構取消了后端的BRT,所有的數(shù)據(jù)交換都需要通過FRT進行,而目前PCIe單端口的帶寬比Infiniband還是要小一些,因此富士通采用4個交換機主要是為了增加節(jié)點間的帶寬。原來EMC VMAX 40K也是采用4個Rapid IO交換機,也是為了增加帶寬,現(xiàn)在換成Infiniband了后,單端口就56Gbps,因此其最高型號VMAX 400K也是兩個交換機就夠了。
具體到每一個控制模塊CM,我們看一下其內部架構和相關連接技術。我們看到,PCIe交換機的連接采用的是PCIe 3.0,后端磁盤框連接采用SAS 3.0。都是目前最新的版本了。
為什么S3的性能要比S2要好很多,除了CPU和內存提升外,關鍵一點是CM多了一個PFM,也就是大容量flash cache,但奇怪的是接口居然采用PCIe 2.0,不知道為什么不采用3.0,可能是這個閃存卡不支持吧?這個PFM作為二級Cache使用,彌補DRAM的不足。富士通說采用PFM性能比不用提高了4倍。而DX8900 S3比DX8700 S2性能只提高了8倍,最大隨機IOPS是400萬??磥碛布壓涂刂破鲾?shù)量的提升才提高2倍性能,關鍵還是大容量PFM(最大支持60多TB)提高4倍性能,可見這個大容量二級cache的威力。
而華為OceanStor 18000 V3雖然在DRAM上要大于富士通,而且也支持Smart Cache,但需要配置SSD盤,占用SSD槽位,效率上肯定不如PCIe閃存卡。
而EMC VAMX3,雖然DRAM和華為一樣是16TB,但目前EMC高端還沒有實現(xiàn)SSD cache的機制(中端支持),目前其SSD只能做分層使用。
富士通的CM都有兩個BUD(鏡像),也就是固態(tài)盤,用來保存OS的image文件,配置信息,而且也是作為掉電保護的臨時數(shù)據(jù)區(qū)。
由于富士通DX8900 S3支持24控,因此可以支持更多的I/O插卡,最大支持384個FC端口,和華為持平。
為了實現(xiàn)掉電保護,每個控制框里面都有BBU電池。這個和富士通的低端產品不同。低端產品由于cache比較小,因此直接采用超級電容的方式。
但磁盤框富士通采用和中低端完全一樣的低密磁盤框。富士通宣稱,DX S3系列只需要更換控制器就可以實現(xiàn)升級。目前,其中低端采用的高密框高端里面并不支持。
為了工程方便,富士通把4個PCIe交換機都放在一個機框里,里面還有一個SVC管理模塊,統(tǒng)稱前端框FE。這個FE是整個系統(tǒng)架構的中樞,控制和數(shù)據(jù)路徑的集中點。這種設計物理上集中在一個框內,容易讓人產生單點故障的錯覺。不知道里面的電源設計是否各自獨立?
由于是高端存儲,一般情況下都需要配置一個1U的網關服務器來實現(xiàn)call home功能。
至于軟件方面,DX8000 S3可以看到實時的電源消耗,這個西瓜哥感覺比較直觀。很多產品只看到溫度,但看不到實時功耗。
DX8000也支持自動QoS。這個軟件功能也是一大特點。也就是可以根據(jù)用戶配置的SLA(支持時延和優(yōu)先級)和自動分層結合起來。
當系統(tǒng)通過調整帶寬和CPU資源也實現(xiàn)不了用戶要求的時延的話,自動分層將自動提高性格卷的高性能容量層的比例,直到時延滿足要求。
這種機制和EMC的SLO的管理方法已經非常類似了。只是EMC更加會營銷,并且采用出廠預配置的方式,易用性更高。但富士通這樣做保持了更高的靈活性。
在RAID方式上,富士通從S3開始就支持一種特別的RAID方式,叫RAID6-FR,F(xiàn)R表示fast recovery,即快速恢復。其原理和華為的RAID 2.0比較類似,只是華為是全局實現(xiàn),而富士通是局部實現(xiàn),因此,還是有一些不同。富士通宣傳1TB磁盤的重構時間是90分鐘,比華為宣傳的30分鐘慢一些,但比傳統(tǒng)的RAID方式已經快了10倍。具體的原理和局限,西瓜哥將在下一節(jié)單獨介紹。
總結一下,富士通DX8000 S3新高端存儲最大的變化就是采用了類似EMC VMAX一樣的松耦合架構,擴展到了24控,400萬IOPS,另外利用大容量的flash cache,性能比老產品提高了8倍。自動QoS和fast recovery也很有特點。但也有一些trade-off,比如拋棄了后端的全連接,4個PCIe交換機物理打包在一個前端框里,可能會引起部分對極致可靠追求用戶的擔憂。
估計幾乎沒有用戶能用到24控,但富士通引領這個高端存儲非常關鍵的指標,一改日系廠商低調保守的形象,估計比較受類似中國政府部門這些喜歡拼參數(shù)的市場的歡迎。好在富士通在中國主要聚焦運營商市場,其他行業(yè)碰到很少。但從新產品的規(guī)格和功能來看,其DX8000 S3是一個比較理想的OEM對象,據(jù)說已經有中國廠商在洽談OEM事宜,高端存儲市場的混戰(zhàn)將不可避免。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網頁分享至朋友圈。