成立于1963年的東安格利亞大學(University of East Anglia,UEA)位于諾里奇(Norwich),是英國老牌重點大學,也是世界公認的擁有一流研究水平的大學。高質(zhì)量的教學與高水平的研究為東安格利亞大學帶來了極高的國內(nèi)和國際學術聲譽,該校近90%的研究成果被認定為具有國際卓越水平,在最新的研究成果評審中超過50%的研究成果被列為世界領先。在環(huán)境科學研究方面,東安格利亞大學一直處于世界領先地位,2007年,該校20多名環(huán)境研究科學家因在環(huán)境科學研究領域的杰出成就與美國前副總統(tǒng)戈爾共同獲得了諾貝爾和平獎。
HPC應用需要拓展
作為一所注重研究的大學,高性能計算平臺對確保UEA各項研究的順利進行至關重要。在過去十多年中,高性能計算(HPC)一直是UEA的重要組成部分,專用的HPC系統(tǒng)支撐著氣候和環(huán)境研究以及化學、計算機科學和數(shù)學學科研究。但隨著研究需求的不斷增長,UEA對計算能力的需求也在增長,原有HPC系統(tǒng)已經(jīng)不能滿足研究工作的需求。搭建綠色HPC平臺不僅對經(jīng)常使用數(shù)據(jù)中心處理研究數(shù)據(jù)的氣候研究人員,而且對UEA來說都是非常重要的,因此,UEA開始尋找方便用戶使用、合適的HPC解決方案,一方面拓展HPC的應用范圍,支撐跨學科的藝術和人文科學等研究;另一方面能以有效的方式增加計算能力,使之可以根據(jù)任務調(diào)度自動控制開啟和關閉系統(tǒng),在讓HPC系統(tǒng)更快、更易于管理、提供的功能更強大的同時,滿足減少碳排放和降低功耗的嚴格要求。
為了建立綠色HPC中心,UEA經(jīng)過仔細比較,選擇了與系統(tǒng)集成商Viglen合作,并采用Platform HPC解決方案。
我們希望能找到比Sun Grid Engine和Cluster Vision解決方案更加智能和擁有更多特點的解決方案。Platform HPC解決方案在提供了先進的集群管理和調(diào)度功能的同時,降低了IT部門的管理負擔,讓管理員能在用戶需要時第一時間協(xié)助他們解決問題。UEA計算機專家兼UEA氣候研究所(CRU)所長Collins先生說。
讓新的HPC能為更多的學科研究提供支撐也是UEA選用Platform HPC解決方案的一個重要原因。Viglen HPC產(chǎn)品經(jīng)理David Power說:需要用到HPC資源的用戶形形色色,應用也多種多樣,這就要求新的HPC解決方案能支持各種不同的應用。Platform HPC解決方案允許多個操作系統(tǒng)在同一時間在同一個集群上運行,從而拓展了HPC應用范圍,用戶群超越了傳統(tǒng)的HPC學科,整個大學的用戶都能受用。
Platform HPC解決方案易于使用的Web界面是UEA決定采用Platform HPC解決方案的另一個重要因素。易于使用的Web界面為用戶帶來了巨大的好處,如果非HPC用戶需要使用該系統(tǒng),他們可以通過Web界面來使用,而無需使用命令行接口。Collins說。利用Platform HPC解決方案,我們不必化費太大的力氣或者做大量的編程工作,就能發(fā)布一個新的應用。
Viglen的CEO BordanTkachuk先生說:Viglen非常重視計算中心的綠色節(jié)能,特別是在傳統(tǒng)的高計算能力和高功耗的HPC領域。UEA成功部署Platform HPC解決方案說明,利用領先的HPC技術,可以在保證充足的計算能力的同時,降低能耗。
BordanTkachuk先生進一步補充說:UEA需要一個更快、更容易管理、擁有更多能力的管理系統(tǒng)。計算能力的增加使UEA進行研究時可以跨更大的數(shù)據(jù)集,并可以在比以前更細的粒度級別進行研究。UEA新的HPC平臺是卓越的高性能研究平臺,可以滿足UEA世界領先級研究的需要。
計算能力翻番
UEA新的HPC平臺擁有2032內(nèi)核和168個計算節(jié)點。UEA也在集群上增加了GPU節(jié)點以增加處理能力。新HPC系統(tǒng)投入使用后,短短幾個月的內(nèi),就為UEA增加了一倍多的計算能力,從9萬億次浮點的運算能力增至21.5萬億次浮點,計算能力顯著增加。
數(shù)據(jù)中心是UEA電力消耗最大的部門,如今,Platform HPC解決方案正在幫助UEA減少碳排放和降低能耗,從而節(jié)省資金。這在很大程度上得益于可根據(jù)需要量和使用量自動開啟和關閉電源系統(tǒng)。實施Platform HPC之前,UEA無法優(yōu)化能耗,因為即使沒有運行工作負載,系統(tǒng)仍然消耗能源?,F(xiàn)在,UEA可以關閉不使用的節(jié)點,顯著減少能源浪費和成本。 Collins說。
遷移更簡單、安全。我們需要不斷地將新用戶遷移到HPC平臺上。遷移和鏈接應用是繁瑣的過程。在此之前,我們必須區(qū)分哪些節(jié)點的應用是可以運行的。采用Platform HPC解決方案后,利用Platform MPI,我們可以在Ethernet和Infiniband上為應用提出請求,并輕松地將它鏈接到Platform MPI。 Collins說。
Platform HPC解決方案提供的豐富的管理功能讓Collins和他的團隊受益匪淺。借助Platform HPC,主節(jié)點能感知作業(yè)隊列的資源需求量和每個節(jié)點的進程,及時關閉暫時不需要的節(jié)點。當資源使用量增加時,主節(jié)點可以在一兩分鐘內(nèi)開啟相應的節(jié)點以滿足需求。Collins說。
Platform HPC還帶來了以下好處:
•根據(jù)特定任務對硬件的需求,智能地分配工作負載,幫助UEA提高計算資源的使用率;
•更有效地使用軟件許可,最大限度地提高吞吐量,并利用Platform HPC降低管理難度;
•通過Platform MPI簡化對并行作業(yè)的管理。
Collins對Platform HPC解決方案非常滿意。UEA目前正計劃購買更多的Platform HPC軟件許可,爭取在未來一年內(nèi)將系統(tǒng)的規(guī)模再次翻番,從而讓整個UEA都能利用HPC環(huán)境進行高性能計算,繼續(xù)保持其世界領先的研究水平。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。