IT行業(yè)日新月異的發(fā)展有目共睹,然而有一個市場卻一直保持著穩(wěn)定而緩慢的發(fā)展腳步——存儲。相對于其他產(chǎn)品,存儲的技術門檻更高,無論是數(shù)據(jù)安全性、可恢復性、高可用性以及管理性,都要比其它的IT產(chǎn)品復雜的多。
然而隨著近幾年互聯(lián)網(wǎng)的不斷壯大,特別是云計算、大數(shù)據(jù)等技術的沖擊下,存儲領域也開始發(fā)生顛覆性變革,那就是介質(zhì)的變化。業(yè)務互聯(lián)網(wǎng)化、云化的需求越來越明顯,企業(yè)對于存儲的要求不再局限于處理的速度、容量和可靠性,而是能為數(shù)據(jù)中心帶來最優(yōu)效率、靈活性、規(guī)模、成本和數(shù)據(jù)保護的存儲解決方案。這些都使傳統(tǒng)存儲越來越無力招架,企業(yè)開始將希望寄于軟件定義技術。2015 年年中,傳統(tǒng)存儲行業(yè)老大 EMC 被服務器廠商 DELL 收購為這場技術變革奠定重要的里程碑。
與此同時,傳統(tǒng)虛擬化廠家 VMware 也推出 VSAN 來替代昂貴且過時的集中式存儲設備。以可彈性擴展、更易用的存儲解決方案,降低數(shù)據(jù)中心的整體擁有成本。但VSAN的本質(zhì)是SAN存儲,提供的是“塊”接口的數(shù)據(jù)存儲功能,不提供NFS服務。為了滿足虛擬機中需要文件共享的需求,大多數(shù)情況下需要在單個虛擬機中部署NFS服務,這種集中式的部署方式無法充分利用VSAN的橫向擴展性能。
為了豐富VSAN存儲方案,VMware與以軟件定義存儲技術見長的達沃時代合作,由其開發(fā)VNAS提供并行文件服務。在接受51CTO記者采訪時,達沃時代副總裁、CTO雷迎春博士介紹了VNAS與VSAN的協(xié)作方式,剖析了分布式文件系統(tǒng)的開發(fā)難度何在,同時也展望了他眼中的軟件定義技術發(fā)展趨勢。
VNAS:軟件定義的分布式并行NAS
VNAS是運行在VMware虛擬中的一種NAS虛 擬化服務,它的部署非常簡單,利用VSAN虛擬出來的硬盤,通過VMware的vSphere一鍵操作即可完成部署。其核心是達沃自主研發(fā)的分布式文件系 統(tǒng)YeeFS,對外提供標準的NFS/CIFS接口,以及集群式NAS服務。由于它與VSAN運行在同一個宿主機上,即使VMs遷移了,還是可以實現(xiàn)對 StorgeVM的就近訪問,與VMs位置無關。另外,通過創(chuàng)新數(shù)據(jù)調(diào)度等技術,VNAS提供全活集群的保障機制,因此當本地StorgeVM故障 時,VMs仍可以通過其他Host上的StorgeVM繼續(xù)訪問相關數(shù)據(jù)。當然,VNAS對故障的判斷,需要VSAN提供相應的物理資源信息。
除標準的NFS/CIFS接口外,VNAS也為客戶提供私有協(xié)議支持,為應用提供符合工業(yè)標準的Posix接口。運行在Windows、Linux操作系統(tǒng)之上的應用軟件都不需要更改即可訪問。通過選擇私有協(xié)議的方式,避免不必要的協(xié)議處理,提升系統(tǒng)的可用性和可靠性。
為了使大家進一步明確VNAS對VSAN性能的補充,雷迎春以具體應用實例來加以說明。比如,雖然VSAN本身有Hadoop解決方案,但Hadoop的底層是HDFS文件接口,VNAS允許新增HDFS接口,從而更好地支持Hadoop應用在VSAN環(huán)境下的運行。
分布式存儲的核心在于共享
國內(nèi)提供分布式存儲服務的廠商并不少見,達沃作為一家成立只有五年的初創(chuàng)型公司,究竟憑借什么獲得VMware的青睞呢?雷迎春認為,除了利于VMware在中國本土環(huán)境下的業(yè)務擴展,更重要的是達沃在存儲領域,特別是分布式文件系統(tǒng)研發(fā)方面有較為領先的技術優(yōu)勢。
雷迎春談到,國內(nèi)存儲廠商中提供“塊”存儲服務的居多,真正自主研發(fā)分布文件系統(tǒng)的服務商還是很少見的。市場上見到的一些分布式文件存儲產(chǎn)品, 也基本是基于GlusterFS、CephFS等開源系統(tǒng)。但對于企業(yè)存儲來說,可靠性永遠是第一位的,因此在缺少足夠技術維護人員的情況下,開源存儲系統(tǒng)較難投入到企業(yè)真正的生產(chǎn)環(huán)境當中。
雷迎春進一步分析到,分布式文件系統(tǒng)的研發(fā)難度較大。很多應用都依賴于文件系統(tǒng)提供的原子語義,這就要求分布式文件系統(tǒng)在保證性能的前提下,還 需要使許多文件操作具有原子語義。例如,創(chuàng)建文件這個簡單操作就需要原子完成,要么成功,要么失敗,不允許中間過程,否則,系統(tǒng)就不一致,或者存在垃圾資 源。
在云計算帶來的變革下,未來應用部署的主流形式將主要集中在Docker和虛擬機中。“塊”存儲技術解決了盤陣的問題,但應用上云后,應用和應用間共享數(shù)據(jù)時,文件是一種常用的方式。對名字空間進行虛擬化和統(tǒng)一,完成對海量數(shù)據(jù)的統(tǒng)一管理和共享。
應用定義存儲是重要的趨勢之一
采訪最后雷迎春談到,存儲和應用的耦合效力、耦合的好壞,會直接影響應用的使用和效能。另一方面,不同的應用對于存儲有不同的需求。例如,在傳統(tǒng)的三層架構下,應用與存儲間是分離的,它們之間一般通過iSCSI或NFS標準協(xié)議溝通。而在超融合架構下,VSAN通過嵌入到vSphere框架實現(xiàn)應用和存儲的直接溝通,獲得較好的性能和可靠性。應用定義的存儲應該是存儲發(fā)展的一個重要趨勢。
現(xiàn)在大家都在談論數(shù)據(jù)智能化,雷迎春認為數(shù)據(jù)分析是其中重要的一方面,還有一個可以嘗試的方面是對數(shù)據(jù)語義的理解,挖掘數(shù)據(jù)之間的關系,進而影 響數(shù)據(jù)在物理介質(zhì)上的部署方式,改善存儲性能。當然,做好這個工作的前提之一是需要對應用有一定的理解。未來達沃將專注于解決存儲和應用的結合問題,通過 應用超強的可調(diào)整性與存儲進行良好的耦合,存儲努力地配合應用的需求,使應用開發(fā)者可以不用過多地關注存儲層面而把更多的精力放在業(yè)務層面。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。