成立于1963年的東安格利亞大學(xué)(University of East Anglia,UEA)位于諾里奇(Norwich),是英國(guó)老牌重點(diǎn)大學(xué),也是世界公認(rèn)的擁有一流研究水平的大學(xué)。高質(zhì)量的教學(xué)與高水平的研究為東安格利亞大學(xué)帶來(lái)了極高的國(guó)內(nèi)和國(guó)際學(xué)術(shù)聲譽(yù),該校近90%的研究成果被認(rèn)定為具有國(guó)際卓越水平,在最新的研究成果評(píng)審中超過(guò)50%的研究成果被列為世界領(lǐng)先。在環(huán)境科學(xué)研究方面,東安格利亞大學(xué)一直處于世界領(lǐng)先地位,2007年,該校20多名環(huán)境研究科學(xué)家因在環(huán)境科學(xué)研究領(lǐng)域的杰出成就與美國(guó)前副總統(tǒng)戈?duì)柟餐@得了諾貝爾和平獎(jiǎng)。
HPC應(yīng)用需要拓展
作為一所注重研究的大學(xué),高性能計(jì)算平臺(tái)對(duì)確保UEA各項(xiàng)研究的順利進(jìn)行至關(guān)重要。在過(guò)去十多年中,高性能計(jì)算(HPC)一直是UEA的重要組成部分,專用的HPC系統(tǒng)支撐著氣候和環(huán)境研究以及化學(xué)、計(jì)算機(jī)科學(xué)和數(shù)學(xué)學(xué)科研究。但隨著研究需求的不斷增長(zhǎng),UEA對(duì)計(jì)算能力的需求也在增長(zhǎng),原有HPC系統(tǒng)已經(jīng)不能滿足研究工作的需求。搭建綠色HPC平臺(tái)不僅對(duì)經(jīng)常使用數(shù)據(jù)中心處理研究數(shù)據(jù)的氣候研究人員,而且對(duì)UEA來(lái)說(shuō)都是非常重要的,因此,UEA開(kāi)始尋找方便用戶使用、合適的HPC解決方案,一方面拓展HPC的應(yīng)用范圍,支撐跨學(xué)科的藝術(shù)和人文科學(xué)等研究;另一方面能以有效的方式增加計(jì)算能力,使之可以根據(jù)任務(wù)調(diào)度自動(dòng)控制開(kāi)啟和關(guān)閉系統(tǒng),在讓HPC系統(tǒng)更快、更易于管理、提供的功能更強(qiáng)大的同時(shí),滿足減少碳排放和降低功耗的嚴(yán)格要求。
為了建立綠色HPC中心,UEA經(jīng)過(guò)仔細(xì)比較,選擇了與系統(tǒng)集成商Viglen合作,并采用Platform HPC解決方案。
我們希望能找到比Sun Grid Engine和Cluster Vision解決方案更加智能和擁有更多特點(diǎn)的解決方案。Platform HPC解決方案在提供了先進(jìn)的集群管理和調(diào)度功能的同時(shí),降低了IT部門(mén)的管理負(fù)擔(dān),讓管理員能在用戶需要時(shí)第一時(shí)間協(xié)助他們解決問(wèn)題。UEA計(jì)算機(jī)專家兼UEA氣候研究所(CRU)所長(zhǎng)Collins先生說(shuō)。
讓新的HPC能為更多的學(xué)科研究提供支撐也是UEA選用Platform HPC解決方案的一個(gè)重要原因。Viglen HPC產(chǎn)品經(jīng)理David Power說(shuō):需要用到HPC資源的用戶形形色色,應(yīng)用也多種多樣,這就要求新的HPC解決方案能支持各種不同的應(yīng)用。Platform HPC解決方案允許多個(gè)操作系統(tǒng)在同一時(shí)間在同一個(gè)集群上運(yùn)行,從而拓展了HPC應(yīng)用范圍,用戶群超越了傳統(tǒng)的HPC學(xué)科,整個(gè)大學(xué)的用戶都能受用。
Platform HPC解決方案易于使用的Web界面是UEA決定采用Platform HPC解決方案的另一個(gè)重要因素。易于使用的Web界面為用戶帶來(lái)了巨大的好處,如果非HPC用戶需要使用該系統(tǒng),他們可以通過(guò)Web界面來(lái)使用,而無(wú)需使用命令行接口。Collins說(shuō)。利用Platform HPC解決方案,我們不必化費(fèi)太大的力氣或者做大量的編程工作,就能發(fā)布一個(gè)新的應(yīng)用。
Viglen的CEO BordanTkachuk先生說(shuō):Viglen非常重視計(jì)算中心的綠色節(jié)能,特別是在傳統(tǒng)的高計(jì)算能力和高功耗的HPC領(lǐng)域。UEA成功部署Platform HPC解決方案說(shuō)明,利用領(lǐng)先的HPC技術(shù),可以在保證充足的計(jì)算能力的同時(shí),降低能耗。
BordanTkachuk先生進(jìn)一步補(bǔ)充說(shuō):UEA需要一個(gè)更快、更容易管理、擁有更多能力的管理系統(tǒng)。計(jì)算能力的增加使UEA進(jìn)行研究時(shí)可以跨更大的數(shù)據(jù)集,并可以在比以前更細(xì)的粒度級(jí)別進(jìn)行研究。UEA新的HPC平臺(tái)是卓越的高性能研究平臺(tái),可以滿足UEA世界領(lǐng)先級(jí)研究的需要。
計(jì)算能力翻番
UEA新的HPC平臺(tái)擁有2032內(nèi)核和168個(gè)計(jì)算節(jié)點(diǎn)。UEA也在集群上增加了GPU節(jié)點(diǎn)以增加處理能力。新HPC系統(tǒng)投入使用后,短短幾個(gè)月的內(nèi),就為UEA增加了一倍多的計(jì)算能力,從9萬(wàn)億次浮點(diǎn)的運(yùn)算能力增至21.5萬(wàn)億次浮點(diǎn),計(jì)算能力顯著增加。
數(shù)據(jù)中心是UEA電力消耗最大的部門(mén),如今,Platform HPC解決方案正在幫助UEA減少碳排放和降低能耗,從而節(jié)省資金。這在很大程度上得益于可根據(jù)需要量和使用量自動(dòng)開(kāi)啟和關(guān)閉電源系統(tǒng)。實(shí)施Platform HPC之前,UEA無(wú)法優(yōu)化能耗,因?yàn)榧词箾](méi)有運(yùn)行工作負(fù)載,系統(tǒng)仍然消耗能源?,F(xiàn)在,UEA可以關(guān)閉不使用的節(jié)點(diǎn),顯著減少能源浪費(fèi)和成本。 Collins說(shuō)。
遷移更簡(jiǎn)單、安全。我們需要不斷地將新用戶遷移到HPC平臺(tái)上。遷移和鏈接應(yīng)用是繁瑣的過(guò)程。在此之前,我們必須區(qū)分哪些節(jié)點(diǎn)的應(yīng)用是可以運(yùn)行的。采用Platform HPC解決方案后,利用Platform MPI,我們可以在Ethernet和Infiniband上為應(yīng)用提出請(qǐng)求,并輕松地將它鏈接到Platform MPI。 Collins說(shuō)。
Platform HPC解決方案提供的豐富的管理功能讓Collins和他的團(tuán)隊(duì)受益匪淺。借助Platform HPC,主節(jié)點(diǎn)能感知作業(yè)隊(duì)列的資源需求量和每個(gè)節(jié)點(diǎn)的進(jìn)程,及時(shí)關(guān)閉暫時(shí)不需要的節(jié)點(diǎn)。當(dāng)資源使用量增加時(shí),主節(jié)點(diǎn)可以在一兩分鐘內(nèi)開(kāi)啟相應(yīng)的節(jié)點(diǎn)以滿足需求。Collins說(shuō)。
Platform HPC還帶來(lái)了以下好處:
•根據(jù)特定任務(wù)對(duì)硬件的需求,智能地分配工作負(fù)載,幫助UEA提高計(jì)算資源的使用率;
•更有效地使用軟件許可,最大限度地提高吞吐量,并利用Platform HPC降低管理難度;
•通過(guò)Platform MPI簡(jiǎn)化對(duì)并行作業(yè)的管理。
Collins對(duì)Platform HPC解決方案非常滿意。UEA目前正計(jì)劃購(gòu)買(mǎi)更多的Platform HPC軟件許可,爭(zhēng)取在未來(lái)一年內(nèi)將系統(tǒng)的規(guī)模再次翻番,從而讓整個(gè)UEA都能利用HPC環(huán)境進(jìn)行高性能計(jì)算,繼續(xù)保持其世界領(lǐng)先的研究水平。