能夠在云環(huán)境中獲得高性能嗎?答案是肯定的。
過去,高性能計算(HPC)并不需要云資源。IT部門經(jīng)常根據(jù)摩爾定律來預(yù)測處理器速度的快速提升,但如今摩爾定律已陷入停滯,導(dǎo)致單核(單線程)的速度在3GHz左右徘徊。顯然,僅靠通過增添計算資源來提高計算能力已經(jīng)不可行了。在這種情況下,需要高性能計算的機構(gòu)必須購置額外的物理基礎(chǔ)架構(gòu)或找到一條通向云計算的可行之路。
IT預(yù)算短缺以及數(shù)據(jù)中心面臨的電力和冷卻等問題促使企業(yè)必須合理地規(guī)劃資源的使用。通過額外購買物理基礎(chǔ)架構(gòu)雖然能滿足峰值工作負(fù)載,但可能會造成非峰值期資產(chǎn)的閑置不用,因為高性能計算工作負(fù)載具有突發(fā)性,即大型項目在短時間內(nèi)需要很多計算資源。如果企業(yè)并不想為峰值工作負(fù)載構(gòu)建系統(tǒng),其結(jié)果又可能不能隨時有充足的計算資源可用。
精心設(shè)計的高性能計算環(huán)境可以充分利用云基礎(chǔ)架構(gòu),并獲得高性能、高利用率以及動態(tài)擴展集群規(guī)模以處理峰值工作負(fù)載的能力。一些高性能計算企業(yè)云計算實踐結(jié)果有力地證明了HPC云應(yīng)用既在技術(shù)上切實可行,又能帶來經(jīng)濟效益,是可以實現(xiàn)既定目標(biāo)的。
Platform提供的一系列強大而靈活的HPC云解決方案,使用戶可以通過配置HPC數(shù)據(jù)中心,來滿足云風(fēng)暴的需求。Platform可以幫助用戶提高在云基礎(chǔ)設(shè)施中運行的HPC應(yīng)用程序的利用率。Platform提供的工具包括提供動態(tài)主機功能的Platform LSF、Platform MultiCluster協(xié)調(diào)工具和用于基礎(chǔ)設(shè)施共享的Platform ISF,為創(chuàng)建滿足高性能計算應(yīng)用程序需求的云環(huán)境提供方便。
工作負(fù)載調(diào)度。使用云環(huán)境下的Platform LSF動態(tài)主機功能,云資源在運行時就像是擁有本地IP地址和主機名稱的現(xiàn)場HPC數(shù)據(jù)中心。任務(wù)提交后,內(nèi)置在軟件中的Platform LSF守護程序可讓云資源識別映像請求,并通過添加有效映像來準(zhǔn)備好處理工作負(fù)載的資源。發(fā)送到云的工作負(fù)載可進行完善,只要允許用戶標(biāo)記某任務(wù),確保應(yīng)用程序、數(shù)據(jù)和云資源經(jīng)配置后,就可在云中運行。
多集群管理。使用結(jié)合Platform LSF的Platform MultiCluster協(xié)調(diào)工具解決方案,用戶就能開始與任何云或主機托管提供商一起建立新的集群,而不需要專用鏈路。云集群變得可用,用戶可以使用MultiCluster來處理工作負(fù)載在內(nèi)部HPC集群與基于云的外部集群資源之間的分配。當(dāng)然,還必須考慮安全、監(jiān)管、服務(wù)級別協(xié)議/服務(wù)級別目標(biāo)(SLA/SLO)等因素驅(qū)動。
云管理。Platform ISF擁有處理多種不同類型系統(tǒng)的資源工具包,其中包括物理或虛擬系統(tǒng);Linux/Unix/Windows系統(tǒng);VMware、XEN、Hyper-V和KVM等虛擬機;亞馬遜和Rackspace等云資源。
通過結(jié)合使用Platform ISF和Platform LSF,用戶能夠自動向上或向下擴展集群。Platform ISF可以管理物理資源和虛擬化資源,同時還能向外擴展到其他服務(wù)器——或者擴展到企業(yè)內(nèi)部的基礎(chǔ)設(shè)施,或者擴展到企業(yè)外部的云托管提供商、云計算公司或其他類型的服務(wù)提供商。物理資源還可以根據(jù)需要,自動重新配置,以滿足應(yīng)用程序的需要,比如操作系統(tǒng)的特定要求。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。