增加對(duì)象存儲(chǔ)的性能多達(dá)100倍是否是有可能的?現(xiàn)在,可能是時(shí)候?qū)SD閃存和對(duì)象存儲(chǔ)同時(shí)部署在一起了,在本文中,我們將為廣大讀者諸君介紹關(guān)于同時(shí)使用這兩者在性能和可靠性方面所帶來(lái)的益處。此外,我們還將為您介紹關(guān)于提高數(shù)據(jù)存儲(chǔ)效率的七個(gè)技巧。
現(xiàn)在,可能是時(shí)候?qū)SD閃存用于對(duì)象存儲(chǔ)了
對(duì)象存儲(chǔ)已經(jīng)成為近線存儲(chǔ)(Nearline storage)、云存儲(chǔ)、Hadoop存儲(chǔ),甚至NoSQL存儲(chǔ)的一個(gè)流行的首選。然而,用于對(duì)象存儲(chǔ)的主要介質(zhì)類型并不是SSD閃存存儲(chǔ),反而一直并 將繼續(xù)是3.5英寸,7200轉(zhuǎn)速的HDD FAT硬盤。這背后的邏輯是,對(duì)象存儲(chǔ)主要是輔助存儲(chǔ)。其性能不是驅(qū)動(dòng)因素。而以非常低的成本獲得可擴(kuò)展性、可靠性和耐用性才是對(duì)象存儲(chǔ)銷售增長(zhǎng)的主要因 素。
但是,如果對(duì)象存儲(chǔ)所能夠提供的性能較之其當(dāng)前所提供性能能夠增加高達(dá)100倍,并且是以相同或更低的成本提供相同或更好的耐久性和更密集的可擴(kuò)展性占用空間呢?根據(jù)公開(kāi)發(fā)布的SSD閃存存儲(chǔ)和FAT HDD硬盤讀取優(yōu)化藍(lán)圖顯示,這一愿景有望在2016年底實(shí)現(xiàn)。
而這一藍(lán)圖愿景的實(shí)現(xiàn)首先是從在對(duì)象存儲(chǔ)中所使用的媒介類型開(kāi)始的。由于大多數(shù)被作為對(duì)象存儲(chǔ)的數(shù)據(jù)都不是需要被頻繁訪問(wèn)的——畢竟,這都是屬于次 要的數(shù)據(jù)——而媒介最大的因素是成本和密度,而不是對(duì)象存儲(chǔ)的性能。這就是為什么今天的媒介是FAT驅(qū)動(dòng)器且每個(gè)HDD硬盤的存儲(chǔ)原始容量范圍是從4 TB到10 TB,這使得其能夠以最小的占用空間每TB的成本最低。
讀取優(yōu)化的SSD閃存存儲(chǔ)被設(shè)計(jì)為用于同一類型的數(shù)據(jù),但僅僅只有更小的2.5英寸的足跡,這占到了3.5英寸HDD硬盤驅(qū)動(dòng)器40%的容量和 10%的重量。讀取優(yōu)化的SSD是專為約10%的寫(xiě)入和90%的讀取而設(shè)計(jì)的。新的多層3D或垂直三級(jí)單元(TLC)NAND是理想的讀取優(yōu)化的SSD。 目前市場(chǎng)上最高容量的2.5英寸,讀取優(yōu)化的SSD在2015年底的原始容量大約為4 TB。而這一切改變得相當(dāng)...快。
在2016年第一季度,三星公司的基于256GB的TLC NAND芯片的一款32層、16 TB、讀取優(yōu)化、2.5英寸(SAS或SATA)的閃存SSD產(chǎn)品開(kāi)始出貨。到第三季度,幾家其它的供應(yīng)廠商的類似產(chǎn)品也紛紛出貨。而預(yù)計(jì)到2016年第 四季度,24 TB和32 TB的讀取優(yōu)化的2.5英寸固態(tài)硬盤閃存有望大規(guī)模上市。而預(yù)計(jì)到2017年,英特爾、Micron(美國(guó)鎂光)、 三星和東芝的48 TB和96 TB的讀取優(yōu)化的2.5英寸SSD閃存產(chǎn)品也將出貨。到2018年,上述供應(yīng)廠商都期望在128 TB和256 TB的2.5英寸的讀取優(yōu)化的閃存固態(tài)硬盤市場(chǎng)獲得加速增長(zhǎng)。較之FAT 3.5英寸的近線硬盤驅(qū)動(dòng)容量,今天,最大容量的HDD硬盤為10 TB。根據(jù)希捷和西部數(shù)據(jù)公司預(yù)計(jì),到2020年,這一容量將增加到20 TB。而如果他們能夠加快研發(fā)的話,則有望能夠在2020年達(dá)到40 TB的容量——但這可能是一個(gè)低概率事件。無(wú)論如何,容量差距是如此巨大,而且還在進(jìn)一步被快速拉開(kāi)。
可靠性如何?
最近,由多倫多大學(xué)和谷歌公司聯(lián)合進(jìn)行的一項(xiàng)關(guān)于閃存SSD固態(tài)硬盤生產(chǎn)領(lǐng)域的研究顯示:
原始比特誤碼率(raw bit error rate,RBER)在以一個(gè)非常慢的速度增長(zhǎng),其要比一般認(rèn)為的速率慢得多。而更重要的則是,它們對(duì)于不可校正錯(cuò)誤或其他錯(cuò)誤模式是不能預(yù)測(cè)的。相較于 傳統(tǒng)HDD硬盤,閃存SSD固態(tài)硬盤在該領(lǐng)域具有明顯更低的替代率;然而,它們具有較高的不可校正的錯(cuò)誤率。
根據(jù)Gartner公司和其他業(yè)內(nèi)分析機(jī)構(gòu)預(yù)測(cè),讀取優(yōu)化的閃存SSD和近線FAT HDD硬盤的成本交叉點(diǎn)——即每TB的計(jì)算購(gòu)置成本,將在2016年出現(xiàn)。
這意味著這些大容量、讀取優(yōu)化的閃存的閃存SSD固態(tài)硬盤對(duì)于對(duì)象存儲(chǔ)是最為理想的。原因如下:因?yàn)殚W存NAND的本質(zhì),SSD讀寫(xiě)次數(shù) (program-erase,PE)塊更有可能出現(xiàn)運(yùn)行失敗或產(chǎn)生不可恢復(fù)的寫(xiě)操作錯(cuò)誤。而讀取操作則很少產(chǎn)生不可恢復(fù)的錯(cuò)誤,雖然可能出現(xiàn)讀取受干擾 的情況,但這是極為罕見(jiàn)的。對(duì)象存儲(chǔ)的糾刪碼基本上是在不同PE塊、驅(qū)動(dòng)器和節(jié)點(diǎn)寫(xiě)入對(duì)象作為多個(gè)子對(duì)象。當(dāng)一個(gè)子對(duì)象有一個(gè)不可恢復(fù)的錯(cuò)誤時(shí),對(duì)象存儲(chǔ) 會(huì)將其簡(jiǎn)單的寫(xiě)在別的地方,SSD將淘汰該P(yáng)E塊。然后其在SSD中從過(guò)度配置的庫(kù)存中維持容量能力。這使得讀取優(yōu)化的SSD閃存存儲(chǔ)非常適用于對(duì)象存 儲(chǔ)。
這一切固然都不錯(cuò),但SSD閃存存儲(chǔ)——即使是讀取優(yōu)化的閃存SSD固態(tài)硬盤——也要比HDD貴出很多呢?其曾經(jīng)的確是的。但SSD和高性能的 HDD硬盤驅(qū)動(dòng)器之間的交叉拐點(diǎn)發(fā)生在2015年。根據(jù)Gartner和業(yè)界的其他分析師們預(yù)測(cè),讀取優(yōu)化的閃存SSD和近線FAT HDD硬盤的成本交叉點(diǎn)——每TB的計(jì)算購(gòu)置成本將在2016年出現(xiàn)。請(qǐng)記住,讀取優(yōu)化的閃存SSD功耗和每TB的原始冷卻成本平均約為10%。加上在數(shù) 據(jù)中心占用空間的節(jié)省和不必使用強(qiáng)化地板,以處理高密度機(jī)架硬盤的重量的成本節(jié)省,使得該成本交叉點(diǎn)很有可能是在2016年底前出現(xiàn)。
使用讀取優(yōu)化的閃存SSD的系統(tǒng)將有更好的對(duì)象存儲(chǔ)性能——高達(dá)2至3倍的速度、占用更少的機(jī)架和占地面積,而且最終成本低于當(dāng)今的對(duì)象存儲(chǔ)。對(duì)于今天的對(duì)象存儲(chǔ)用戶的好消息是,對(duì)象存儲(chǔ)升級(jí)要比傳統(tǒng)存儲(chǔ)簡(jiǎn)單,可以一次在一個(gè)節(jié)點(diǎn)上在線進(jìn)行,而無(wú)需數(shù)據(jù)遷移。
改善數(shù)據(jù)存儲(chǔ)效率的七大技巧
存儲(chǔ)網(wǎng)絡(luò)、服務(wù)器端的閃存、網(wǎng)絡(luò)緩存、軟件定義的存儲(chǔ)和全閃存或混合陣列有助于存儲(chǔ)性能和效率的提升。
企業(yè)組織機(jī)構(gòu)IT專業(yè)人員們需要長(zhǎng)期不斷地與存儲(chǔ)性能進(jìn)行“拉鋸戰(zhàn)”,以便能夠確保其應(yīng)用程序能夠獲得運(yùn)行所需要的資源,實(shí)現(xiàn)最佳性能。而回到當(dāng)硬 盤技術(shù)還是最先進(jìn)的技術(shù)的時(shí)候,這意味著彼時(shí)的企業(yè)組織機(jī)構(gòu)所采用的是成本昂貴且效率低下的技術(shù)——比如即使不是跨數(shù)以百計(jì)的硬盤的話,至少也是跨幾十個(gè) 硬盤來(lái)標(biāo)記數(shù)據(jù),然后格式化這些硬盤驅(qū)動(dòng)器,使得只有一半的容量能力能夠提供給應(yīng)用程序。
而企業(yè)組織機(jī)構(gòu)更為負(fù)擔(dān)得起的閃存的到來(lái),有望在可預(yù)見(jiàn)的未來(lái)打破存儲(chǔ)在應(yīng)用程序性能方面的瓶頸。而為了能夠充分利用閃存,您的企業(yè)組織將需要通過(guò) 采用正確的方式來(lái)部署實(shí)現(xiàn),并同時(shí)還需要采用正確的互補(bǔ)技術(shù)。這樣,您企業(yè)組織才可以從固態(tài)存儲(chǔ)部署和存儲(chǔ)網(wǎng)絡(luò)中獲得性能最大化和更高的效率。
例如,對(duì)于常用活躍數(shù)據(jù)而言,閃存較之硬盤驅(qū)動(dòng)器有較少的移動(dòng)部件,故而能夠提供更好的性能。其結(jié)果是,在主數(shù)據(jù)使用案例的情況下,閃存較之硬盤驅(qū) 動(dòng)器的部署成本往往更便宜,尤其是對(duì)于長(zhǎng)距離持久存儲(chǔ)。固態(tài)存儲(chǔ)的問(wèn)題是,在任何既定的時(shí)間點(diǎn)上,數(shù)據(jù)中心只有約5%至10%的數(shù)據(jù)是常用活躍的。所以您 企業(yè)組織還不如通過(guò)將剩余的90%或更多的數(shù)據(jù)存儲(chǔ)在容量更高、更便宜的HDD硬盤來(lái)節(jié)省一些現(xiàn)金成本,或者干脆和其他越來(lái)越多的企業(yè)都在做的那樣,將這 些剩余的數(shù)據(jù)存儲(chǔ)在云中。
正如上文的這一例子所示,閃存本身并不一定能夠提高數(shù)據(jù)存儲(chǔ)效率和性能。您企業(yè)組織將需要從打造一個(gè)堅(jiān)實(shí)的基礎(chǔ)開(kāi)始,而這也就引出了我們撰寫(xiě)本文所想要為廣大讀者朋友們介紹的關(guān)于實(shí)現(xiàn)更快、更高效的存儲(chǔ)的七大技巧的第一點(diǎn):改善存儲(chǔ)網(wǎng)絡(luò)
的確,基于硬盤的系統(tǒng)的延遲性并不會(huì)暴露一個(gè)網(wǎng)絡(luò)的弱點(diǎn),但一個(gè)基于閃存的系統(tǒng)則會(huì)。因此,當(dāng)您所在的企業(yè)組織升級(jí)到閃存或?yàn)楝F(xiàn)有的系統(tǒng)添加額外的 固態(tài)硬盤之前,您應(yīng)該首先最大限度地提高您企業(yè)存儲(chǔ)網(wǎng)絡(luò)的能力。而您所需要考慮的關(guān)于企業(yè)網(wǎng)絡(luò)的三個(gè)組成部分則包括:在服務(wù)器和存儲(chǔ)系統(tǒng)中的主機(jī)總線適配 器(Host BusAdapter,HBA)或網(wǎng)絡(luò)接口卡(NIC)、網(wǎng)絡(luò)交換機(jī)和布線基礎(chǔ)設(shè)施。
人們很容易只關(guān)注帶寬能力的前兩個(gè)組成部分(NIC/HBA和交換機(jī)),其應(yīng)該達(dá)到10 GbE或16 Gbps光纖通道(FC)或更快。雖然帶寬是非常重要的,延遲和交付質(zhì)量更加如此。 大多數(shù)數(shù)據(jù)中心都無(wú)法產(chǎn)生足夠的連續(xù)交易來(lái)沖擊一個(gè)高速網(wǎng)絡(luò)。相反,它們會(huì)產(chǎn)生數(shù)百萬(wàn)個(gè)非常小的交易。網(wǎng)絡(luò)將這些交易從服務(wù)器移動(dòng)到存儲(chǔ),然后再返回的效 率是至關(guān)重要的,以便能夠從一個(gè)閃存的投資中提取最大的性能。
布線也是至關(guān)重要的,而且其往往是在存儲(chǔ)網(wǎng)絡(luò)的性能和數(shù)據(jù)存儲(chǔ)效率中一個(gè)經(jīng)常被忽視的因素。您企業(yè)組織應(yīng)該在光纖基礎(chǔ)上建立布線基礎(chǔ)設(shè)施,以支持當(dāng) 前和下一代網(wǎng)絡(luò)的高帶寬和低延遲能力,并對(duì)其進(jìn)行構(gòu)造,以便可以方便地確定端口分配。您企業(yè)還需要了解“鏈路損耗預(yù)算”,其是連接之間丟失的信號(hào)量。
一旦您已經(jīng)對(duì)您企業(yè)的存儲(chǔ)網(wǎng)絡(luò)進(jìn)行了微調(diào),那么,是時(shí)候來(lái)考慮閃存的部署了。
實(shí)現(xiàn)服務(wù)器端的閃存
在服務(wù)器端的閃存設(shè)計(jì)中,網(wǎng)絡(luò)和連接到該網(wǎng)絡(luò)的存儲(chǔ)仍然是相同的,基本上安裝的是基于硬盤驅(qū)動(dòng)器的存儲(chǔ)陣列,其存儲(chǔ)網(wǎng)絡(luò)的速度和質(zhì)量并沒(méi)有當(dāng)部署一個(gè)共享閃存陣列時(shí)那樣來(lái)得重要。但是,您利用服務(wù)器端的閃存的方式則是可以改變的。
當(dāng)您隔離服務(wù)器閃存時(shí),該設(shè)計(jì)對(duì)于網(wǎng)絡(luò)的影響是最小的。在這里,您企業(yè)安裝一個(gè)固態(tài)硬盤或閃存PCIe卡僅僅只為該服務(wù)器的I/O負(fù)責(zé)。服務(wù)器本身成為一個(gè)單一故障點(diǎn),所以這個(gè)用例只適用于存儲(chǔ)在共享存儲(chǔ)陣列上的數(shù)據(jù)的讀高速緩存。
相比之下,服務(wù)器端的閃存技術(shù),從多臺(tái)服務(wù)器聚集了內(nèi)部閃存,以創(chuàng)建一個(gè)虛擬的閃存池。這些服務(wù)器端的閃存聚合產(chǎn)品建立在冗余,適用于讀和寫(xiě)緩存,甚至作為一個(gè)存儲(chǔ)層。然而,他們確實(shí)在性能方面引入了網(wǎng)絡(luò)因素,因?yàn)榫酆闲枰粋€(gè)網(wǎng)絡(luò)來(lái)創(chuàng)建虛擬存儲(chǔ)池。
部署一個(gè)網(wǎng)絡(luò)緩存
不同于存儲(chǔ)系統(tǒng)的升級(jí),其僅僅只是增加了一個(gè)單一系統(tǒng)的性能,一個(gè)網(wǎng)絡(luò)緩存則能夠提升網(wǎng)絡(luò)上的每個(gè)存儲(chǔ)系統(tǒng)的性能。這些設(shè)備基本上是在存儲(chǔ)系統(tǒng)和服 務(wù)器之間內(nèi)聯(lián)的,緩存最常見(jiàn)活躍的數(shù)據(jù)。許多網(wǎng)絡(luò)緩存在高可用性的配置中是可用的,這使得它們適合緩存讀取和寫(xiě)入I/O。您也可以規(guī)模化網(wǎng)絡(luò)緩存,讓閃存 存儲(chǔ)區(qū)大到足以存儲(chǔ)一家企業(yè)組織的整個(gè)常見(jiàn)活躍數(shù)據(jù)集,實(shí)際上把現(xiàn)有陣列納入到歸檔和數(shù)據(jù)保護(hù)存儲(chǔ)系統(tǒng)。
網(wǎng)絡(luò)緩存的一個(gè)重要的優(yōu)勢(shì)在于其能夠提高存儲(chǔ)性能,而不需要更換當(dāng)前的數(shù)據(jù)保護(hù)政策和程序。這些程序保持不變,因?yàn)楝F(xiàn)在的數(shù)據(jù)將同時(shí)位于高速緩存和原始存儲(chǔ)系統(tǒng)上。
需要注意的是,在快照或備份作業(yè)開(kāi)始之前,尋找一個(gè)可以通過(guò)編程清空緩沖區(qū)數(shù)據(jù)的網(wǎng)絡(luò)緩存是很重要的。您也應(yīng)該在部署之前,考慮您企業(yè)網(wǎng)絡(luò)基礎(chǔ)設(shè)施及其組件的質(zhì)量。
考慮采用一款云支持的網(wǎng)絡(luò)緩存
網(wǎng)絡(luò)緩存選項(xiàng)的變體可以采用一種混合云的方式。一些供應(yīng)廠商——比如Avere、微軟Azure StorSimple、Nasuni和來(lái)自EMC的TwinStrata,提供全閃存網(wǎng)絡(luò)緩存,能夠?qū)⒎腔钴S的數(shù)據(jù)遷移到諸如亞馬遜、Azure或谷歌等 云存儲(chǔ)位置,而不是本地存儲(chǔ)。事實(shí)上,這可能是通往一個(gè)全閃存數(shù)據(jù)中心的最實(shí)用的途徑之一,因?yàn)楝F(xiàn)在的數(shù)據(jù)中心可以是真正全閃存的,而舊的數(shù)據(jù)已經(jīng)在云中 被存儲(chǔ)和保護(hù)。
借助小閃存陣列部署SDS
改善存儲(chǔ)性能和數(shù)據(jù)存儲(chǔ)效率的另一種選擇是使用軟件定義的存儲(chǔ)(SDS)。這些產(chǎn)品要么運(yùn)行在一款設(shè)備上;要么在一個(gè)虛擬機(jī)系統(tǒng)管理程序內(nèi)運(yùn)行,并 能夠跨各種硬件陣列提供一組通用的存儲(chǔ)軟件功能。一些SDS系統(tǒng)可以利用現(xiàn)有的存儲(chǔ)硬件,并在它們之間提供數(shù)據(jù)的自動(dòng)遷移。如果您企業(yè)添加一個(gè)小的閃存陣 列到現(xiàn)有的基礎(chǔ)設(shè)施,您可以使用SDS自動(dòng)遷移最活躍的數(shù)據(jù)集到陣列,以提高性能。而作為一個(gè)額外的獲益,其還簡(jiǎn)化了管理,因?yàn)樗械拇鎯?chǔ)管理變得統(tǒng)一。
優(yōu)化應(yīng)用程序
在部署一款新的或增強(qiáng)現(xiàn)有存儲(chǔ)系統(tǒng)之前,務(wù)必請(qǐng)仔細(xì)檢查您企業(yè)打算運(yùn)行的應(yīng)用程序。許多存儲(chǔ)專業(yè)人員發(fā)現(xiàn)這一點(diǎn)尤其艱巨,因?yàn)樗麄兗炔粨碛羞@些應(yīng)用 程序,也不了解這些應(yīng)用程序的代碼。好消息是,可以使用某些程序來(lái)檢查應(yīng)用程序的代碼,這提供了一個(gè)公正的分析其質(zhì)量的方法,并能夠就需要在哪些地方進(jìn)行 改變提出具體的建議。
雖然人們很容易跳過(guò)這一步,并只是在這個(gè)問(wèn)題上投入更多的硬件,但請(qǐng)千萬(wàn)不要這樣做。一個(gè)與代碼相關(guān)的性能問(wèn)題可能被高性能的存儲(chǔ)所掩蓋,但其決不 允許閃存充分發(fā)揮其全部潛力——從而迫使管理員們?nèi)ふ移渌麧撛诘男阅芷茐恼?,如存?chǔ)網(wǎng)絡(luò)。在部署閃存之前搞定代碼問(wèn)題甚至可能避開(kāi)一開(kāi)始對(duì)于閃存的需 求,或減少您企業(yè)所需要采購(gòu)的閃存需求。
采購(gòu)一個(gè)新的全閃存或混合陣列
這些對(duì)基于現(xiàn)有的硬盤系統(tǒng)仍然在使用壽命期限內(nèi)、且仍在原來(lái)的保修期內(nèi)的數(shù)據(jù)中心是理想的,這樣您就可以重新部署這些舊的硬盤系統(tǒng),并用一個(gè)新的閃 存陣列來(lái)擴(kuò)充他們。但是,在某些時(shí)候,您將需要購(gòu)買新的存儲(chǔ)系統(tǒng)。今天,這意味著在一個(gè)全閃存或混合陣列之間進(jìn)行選擇。最初的決定是相對(duì)簡(jiǎn)單的:如果企業(yè) 組織負(fù)擔(dān)得起全閃存陣列,其將滿足企業(yè)的容量要求(假設(shè)性能要求會(huì)得到滿足是可行的),然后再購(gòu)買一個(gè)。
然而,許多企業(yè)組織都很難找到一款正好適合他們預(yù)算的閃存陣列。他們可以通過(guò)選擇一款混合陣列,來(lái)獲得一款全閃存陣列相同的益處,而又無(wú)需該水平的投資。其將閃存和HDD結(jié)合進(jìn)同一系統(tǒng),然后,通過(guò)軟件在它們之間自動(dòng)遷移數(shù)據(jù)。
對(duì)于混合陣列的主要關(guān)注:高速緩存缺失,已經(jīng)是過(guò)去的事情了。當(dāng)閃存容量的成本如此昂貴,以致于一個(gè)混合陣列的閃存層占總存儲(chǔ)容量的比例還不到5%時(shí),其是一個(gè)需要關(guān)注的問(wèn)題。但是現(xiàn)在,閃存層往往是容量的25%(如果沒(méi)有更多),顯著降低了高速緩存缺失的可能性。
總結(jié)
通往存儲(chǔ)性能提高的道路并不是從一個(gè)全閃存的投資開(kāi)始的。其是從將您企業(yè)組織的存儲(chǔ)網(wǎng)絡(luò)作為一個(gè)整體,進(jìn)行仔細(xì)的檢查開(kāi)始的。一旦您企業(yè)這樣做了, 還有很多其他的提升存儲(chǔ)性能和數(shù)據(jù)存儲(chǔ)效率的選項(xiàng)可以考慮,其中許多都包括了某種類型的閃存存儲(chǔ)的部署。該款產(chǎn)品的效果會(huì)因具體數(shù)據(jù)中心的不同而有所差 異,而正如本文在對(duì)這些技巧進(jìn)行介紹的那樣,某些企業(yè)組織的IT部門可能甚至不需要升級(jí)他們所有的存儲(chǔ)系統(tǒng)。
分享到微信 ×
打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。