就像死亡和稅單一樣,對(duì)于增加存儲(chǔ)空間的需求在當(dāng)下也是人生的必然之一。然而我們要面對(duì)另一個(gè)現(xiàn)實(shí):由于不當(dāng)?shù)脑O(shè)計(jì)和混亂的管理,我們已經(jīng)浪費(fèi)了大量的空間。
對(duì)于存儲(chǔ)空間需求不斷加大的誘因,除了來(lái)自數(shù)據(jù)量的不斷增長(zhǎng)之外,大量的研究表明每個(gè)閃存設(shè)備或者硬盤(pán)上將近70%的空間都被那些令人厭惡的文件拷貝、大量從未被訪問(wèn)過(guò)的數(shù)據(jù)或者不知道從哪里寫(xiě)入的數(shù)據(jù)所占據(jù)了。
從設(shè)計(jì)角度看,我們所浪費(fèi)的相當(dāng)一部分存儲(chǔ)空間是由于引入了軟件定義存儲(chǔ)策略所導(dǎo)致的,因?yàn)槠渲辽傩枰齻€(gè)存儲(chǔ)節(jié)點(diǎn)來(lái)對(duì)所有節(jié)點(diǎn)上的所有數(shù)據(jù)進(jìn)行交叉式的數(shù)據(jù)同步,或者是由于我們采用了過(guò)時(shí)的文件系統(tǒng)來(lái)分配空間——這些空間從來(lái)就沒(méi)有存儲(chǔ)過(guò)哪怕1比特的數(shù)據(jù)。甚至是由于我們?cè)诜峙浯鎯?chǔ)空間時(shí)采用的方法漏洞百出。向服務(wù)器管理員親眼見(jiàn)證那些經(jīng)典的存儲(chǔ)空間分配方法,然后在部署到文件系統(tǒng)之后讓他們自己決定,這些空間能否起到一定作用還是莫名其妙的“蒸發(fā)”了(也許是為了緊急情況使用,或者,算了,作者自己也編不下去了)。
存儲(chǔ)空間利用率低并不僅僅是使用者的問(wèn)題
數(shù)據(jù)存儲(chǔ)行業(yè)在過(guò)去幾年中向我們傳達(dá)了兩件事情:技術(shù)發(fā)展帶來(lái)的奇跡以及以存儲(chǔ)架構(gòu)形式存在的為貪婪埋單的遺跡。從20世紀(jì)八十年代至今,硬盤(pán)空間大約每18個(gè)月就會(huì)翻番,而其成本,每12個(gè)月就會(huì)減半——這就是技術(shù)革新帶來(lái)的好處。反觀存儲(chǔ)陣列的價(jià)格——一堆商業(yè)存儲(chǔ)部件加上一塊由類似服務(wù)器主板的東西作為控制器,最后在機(jī)架中堆疊而成——每年上漲近120%。
成本上升的很大一部分原因來(lái)自于不斷革新的軟件,這些軟件也使得存儲(chǔ)陣列廠商可以為自己的產(chǎn)品貼上獨(dú)有的標(biāo)簽進(jìn)而在市場(chǎng)中獨(dú)樹(shù)一幟,進(jìn)而將那些客戶繼續(xù)使用自己的產(chǎn)品。基于將存儲(chǔ)陣列回到原有的商業(yè)存儲(chǔ)領(lǐng)域這一出發(fā)點(diǎn),通過(guò)將所有附加的軟件產(chǎn)品抽象成完全獨(dú)立的軟件服務(wù)層并部署到服務(wù)器中,軟件定義存儲(chǔ)在某種程度上是可以預(yù)見(jiàn)的。廠商們稱之為革新,但是在我看來(lái),它和大型機(jī)管理存儲(chǔ)(mainframe system managed storage,dfSMS)的作用相似(dfSMS可以對(duì)批量的直連存儲(chǔ)設(shè)備進(jìn)行管理)。
軟件定義存儲(chǔ)策略能否降低存儲(chǔ)陣列的成本還需要拭目以待,尤其是那些由領(lǐng)先的服務(wù)器管理程序廠商推動(dòng)的軟件定義存儲(chǔ)的實(shí)現(xiàn)方法,從架構(gòu)設(shè)計(jì)的角度來(lái)講,這些實(shí)現(xiàn)手段的最終目的是要取代傳統(tǒng)的SAN和NAS系統(tǒng)。由于存儲(chǔ)是打包銷(xiāo)售的,所以資本性開(kāi)銷(xiāo)(Capex)是龐大的。在今天,我們花在IT硬件上的每1美元中,存儲(chǔ)部分就要占掉33美分到70美分,如果我們把這些硬件開(kāi)銷(xiāo)繼續(xù)細(xì)分,例如維保合同、若干年的軟件使用許可(還要考慮到維保以及使用許可的時(shí)間,畢竟我們的存儲(chǔ)要長(zhǎng)期使用下去)等等,那么最后的數(shù)字將會(huì)是相當(dāng)龐大的。
找出巨額開(kāi)銷(xiāo)的真正來(lái)源
然而資本性支出(購(gòu)買(mǎi)成本)僅僅占了一部分而已。如果想找出開(kāi)銷(xiāo)的全部來(lái)源,你就得考慮到經(jīng)營(yíng)支出(Opex),而這部分開(kāi)銷(xiāo)在大部分公司中都不一樣。根據(jù)Gartner的分析,存儲(chǔ)的年度總經(jīng)營(yíng)支出約為年化資本性支出的四到五倍。
經(jīng)營(yíng)支出包括備份和還原、計(jì)劃性宕機(jī)、管理和維護(hù)以及設(shè)施開(kāi)銷(xiāo)(空間、電力以及空調(diào)等等)。這些數(shù)字往往都被人們忽略了而并沒(méi)有被明確的標(biāo)示出來(lái)。我們之所以知道這些數(shù)字的存在,就是因?yàn)橛械臅r(shí)候我們無(wú)法高效率的管理存儲(chǔ)架構(gòu),那時(shí)真正的經(jīng)營(yíng)支出將會(huì)變得相當(dāng)巨大。
我們就不能好好地管理我們的存儲(chǔ)嗎?我們總是傾向于購(gòu)買(mǎi)大量的Tier-1存儲(chǔ)設(shè)備,它們低空間高性能的屬性可以在部署當(dāng)天就帶來(lái)令人側(cè)目的應(yīng)用性能提升——當(dāng)然無(wú)論這些應(yīng)用是不是關(guān)鍵的。但我想說(shuō)的是,這件事兒從一開(kāi)始就做錯(cuò)了。
從傳統(tǒng)意義上來(lái)說(shuō),不同類型存儲(chǔ)的出現(xiàn)是有其原因的。有些設(shè)備是用來(lái)存儲(chǔ)那些在短時(shí)間內(nèi)快速累積起來(lái)的數(shù)據(jù),因?yàn)樗鼈兛梢詽M足交易系統(tǒng)對(duì)高性能的需求。而有些設(shè)備的設(shè)計(jì)初衷是存儲(chǔ)那些定期或者偶爾更新或者修改的大量數(shù)據(jù)。還有些設(shè)備則是用來(lái)存儲(chǔ)那些長(zhǎng)期不被訪問(wèn)甚至幾乎沒(méi)有改動(dòng)的海量數(shù)據(jù)。在一個(gè)良好的管理環(huán)境中,數(shù)據(jù)遵循由自動(dòng)化分層存儲(chǔ)管理或歸檔軟件設(shè)定的策略在層與層之間移動(dòng)。這也許就是我們能控制存儲(chǔ)開(kāi)銷(xiāo)的唯一途徑。
令人煩惱的是,要想使得分層機(jī)制有效地工作,你需要部署集成化的架構(gòu)或者至少有一套通用的管理策略。在個(gè)別情況下,有些廠商將他們的產(chǎn)品與競(jìng)爭(zhēng)對(duì)手的產(chǎn)品的協(xié)同工作弄的很復(fù)雜。有些存儲(chǔ)附帶軟件會(huì)給日常管理帶來(lái)額外的負(fù)擔(dān),而在個(gè)別存儲(chǔ)陣列中,其自帶的文件架構(gòu)系統(tǒng)甚至?xí)谕惔鎯?chǔ)平臺(tái)上獨(dú)占共享數(shù)據(jù)。
尤其是后者,它不僅僅存在于傳統(tǒng)的存儲(chǔ)陣列中。管理軟件廠商通過(guò)“巧妙地”部署自己的SDS堆棧來(lái)阻止自己的存儲(chǔ)資源共享到負(fù)載的處理過(guò)程中,而這些負(fù)載就是那些已經(jīng)通過(guò)其他競(jìng)爭(zhēng)對(duì)手的SDS模型完成虛擬化的部分。
關(guān)于“你們的”存儲(chǔ)是如何變成“他們的”存儲(chǔ)這個(gè)情況,其實(shí)你并不是第一個(gè)受害者。這些專屬的障礙使得我們對(duì)數(shù)據(jù)進(jìn)行自動(dòng)化跨層級(jí)移動(dòng)的能力大大減弱。這種障礙其實(shí)是一個(gè)副產(chǎn)品,它是在SDS向高性能計(jì)算集群借鑒經(jīng)驗(yàn)的時(shí)候不小心出現(xiàn)的。眾多SDS架構(gòu)能夠帶來(lái)影響的關(guān)鍵就在于在每臺(tái)虛擬服務(wù)器背后,都搭建了一套扁平的存儲(chǔ)架構(gòu),而這些架構(gòu)的配置和部署都是完全相同的。這些架構(gòu)就構(gòu)成了基礎(chǔ)的模塊——服務(wù)器、存儲(chǔ)以及SDS中間件的超容和架構(gòu)節(jié)點(diǎn)——他們可以進(jìn)一步的擴(kuò)展出很多空間并且快速地部署,進(jìn)而來(lái)滿足業(yè)務(wù)的需求以及需求的不斷變化。需要在ERP中再增加50個(gè)位置?僅僅需要擴(kuò)展出三個(gè)額外的基礎(chǔ)模塊就可以滿足對(duì)計(jì)算、網(wǎng)絡(luò)以及存儲(chǔ)空間的需求。
這聽(tīng)起來(lái)就像是一條通往真正意義上的敏捷部署的大路,直到你發(fā)現(xiàn)它們背后架構(gòu)的秘密。為了熱點(diǎn)數(shù)據(jù)而準(zhǔn)備的既昂貴空間又低的存儲(chǔ)層級(jí)是不存在的。同理,為訪問(wèn)頻度相對(duì)較低的數(shù)據(jù)專門(mén)設(shè)計(jì)的價(jià)格相對(duì)低廉而空間更大的存儲(chǔ)層級(jí)也是不存在的;當(dāng)然,為冷數(shù)據(jù)以及歸檔數(shù)據(jù)設(shè)計(jì)的大容量低成本的存儲(chǔ)層也是沒(méi)有的。對(duì)于存儲(chǔ)層級(jí)以及數(shù)據(jù)跨層級(jí)移動(dòng)的管理失誤往往會(huì)在很大程度上提高存儲(chǔ)的總體開(kāi)銷(xiāo),而失誤的原因還是在于管理本身。
圍繞SDS以及存儲(chǔ)空間說(shuō)開(kāi)去
軟件定義存儲(chǔ)允許客戶將存儲(chǔ)服務(wù)集成到服務(wù)器的軟件層。這種做法很好,因?yàn)镾DS將軟件從原有的存儲(chǔ)控制器中抽離出來(lái),使得它們的功能得以進(jìn)一步的發(fā)揮而不僅僅局限在單一的設(shè)備中。將數(shù)據(jù)去重功能或者是精簡(jiǎn)配置局限在單一的硬盤(pán)上與把其擴(kuò)展到全部存儲(chǔ)平臺(tái)層面相比,前者實(shí)在是沒(méi)有什么太大意義。在這一點(diǎn)上,SDS的從業(yè)者們并沒(méi)有拖大家的后腿。
真正給大家?guī)?lái)誤導(dǎo)的地方是:將這些軟件集成到服務(wù)器端的軟件堆棧當(dāng)中會(huì)成為存儲(chǔ)管理的萬(wàn)能良藥。然而它并不會(huì)。
除了存儲(chǔ)服務(wù)之外,存儲(chǔ)管理將存儲(chǔ)資源的管理細(xì)分成了以下幾個(gè)方面:存儲(chǔ)物理架構(gòu)、存儲(chǔ)運(yùn)行狀態(tài)以及存儲(chǔ)空間的分配與回收。如果存儲(chǔ)節(jié)點(diǎn)上的硬盤(pán)或者閃存設(shè)備出現(xiàn)故障,并且沒(méi)人能夠發(fā)現(xiàn),那么鏡像功能就不會(huì)起到任何作用,最后導(dǎo)致的結(jié)果就是數(shù)據(jù)復(fù)制服務(wù)的管理形同虛設(shè)。更糟的是,如果存儲(chǔ)無(wú)法根據(jù)變更的需求對(duì)后臺(tái)的數(shù)據(jù)進(jìn)行整合,那么所謂的敏捷部署也無(wú)法得到實(shí)現(xiàn)。
當(dāng)你考慮到這些問(wèn)題的時(shí)候,你會(huì)發(fā)現(xiàn)存儲(chǔ)資源管理無(wú)法并入到管理軟件廠商所鐘愛(ài)的SDS堆棧中的唯一原因就是雙方的關(guān)系并不是那么融洽。如果我們可以將存儲(chǔ)架構(gòu)虛擬出來(lái),即抽象出來(lái)的東西不僅僅是那些軟件,還有那些資源空間的管理部分,那么存儲(chǔ)資源就可以像軟件定義存儲(chǔ)的服務(wù)一樣,更好地實(shí)現(xiàn)分配、回收以及分層。
存儲(chǔ)虛擬化并不是什么新鮮的東西。DataCore Software在這一領(lǐng)域已經(jīng)做了十多年,而IBM 的SAN Volume Controller又對(duì)這一領(lǐng)域帶來(lái)了新的力量。盡管通過(guò)創(chuàng)建共享存儲(chǔ)資源這種做法可以使得存儲(chǔ)資源與SDS相互結(jié)合,讓數(shù)據(jù)運(yùn)行在適合的存儲(chǔ)設(shè)備與服務(wù)上,進(jìn)而優(yōu)化數(shù)據(jù)的使用以及存儲(chǔ)的開(kāi)銷(xiāo),但是當(dāng)今的業(yè)界領(lǐng)先公司似乎對(duì)其并不是很感興趣,。
如果你想利用SDS來(lái)馴服存儲(chǔ)開(kāi)銷(xiāo)這頭野獸,那么軟件定義存儲(chǔ)、超融合架構(gòu)以及過(guò)時(shí)的存儲(chǔ)陣列網(wǎng)絡(luò)都不會(huì)是萬(wàn)能的良藥。當(dāng)你將存儲(chǔ)服務(wù)集中起來(lái)的同時(shí),你也需要考慮將存儲(chǔ)空間虛擬出來(lái)。只有這樣,你才能夠以一種有效的方式保留既定的層級(jí)移動(dòng)策略并且在所有數(shù)據(jù)中共享存儲(chǔ)空間以及存儲(chǔ)服務(wù)。
分享到微信 ×
打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。