中國高性能計(jì)算的發(fā)展,如今已進(jìn)入一個(gè)新的階段,由此產(chǎn)生了更多的新機(jī)遇和新挑戰(zhàn)。具體來說,從原本的科學(xué)計(jì)算已經(jīng)逐漸延伸到了商業(yè)化領(lǐng)域中,發(fā)展的潛力更為巨大;與此同時(shí),互聯(lián)網(wǎng)重新發(fā)現(xiàn)了HPC的價(jià)值,以數(shù)據(jù)分析和機(jī)器學(xué)習(xí)為主的新應(yīng)用帶給了新的想象空間。 從這個(gè)角度來看,中國高性能計(jì)算市場演進(jìn)的新趨勢,也正和戴爾所提的HPC“民眾化”價(jià)值新主張一脈相承,它證明了戴爾對HPC市場超前的判斷力和洞察力。更為關(guān)鍵的是,在此過程中,戴爾始終堅(jiān)持HPC軟硬兼施的兩翼齊飛戰(zhàn)略,也給它未來的發(fā)展帶來了新的驅(qū)動(dòng)力。
解碼高性能計(jì)算新變化
HPC市場已經(jīng)走進(jìn)了一個(gè)新的十字路口。這種變化可以從三個(gè)維度來看,具體而言:
第一,是HPC技術(shù)和產(chǎn)品層面的變化,除了處理器之外,包括GPU和眾核加速器、高性能網(wǎng)絡(luò)設(shè)備以及高性能SSD都進(jìn)一步得到了廣泛的應(yīng)用。
- 從架構(gòu)方式看,Cluster(集群)正在替代MPP(大規(guī)模并行處理)分布式架構(gòu)成為市場主流,這是因?yàn)榧悍植际郊軜?gòu)更為通用,更能有效承載的應(yīng)用范圍更廣。 - 從計(jì)算方式看,高性能數(shù)據(jù)分析(HPDA)應(yīng)用成為了超算的下一個(gè)爆點(diǎn)。數(shù)據(jù)顯示,目前67%的超算資源用于HPDA,這其中欺詐檢測、機(jī)器學(xué)習(xí)、人工智能等需求是其中較為典型的應(yīng)用。
第二,是HPC全球市場的變化。這其中,中國成為了高性能計(jì)算應(yīng)用的新戰(zhàn)場,如今在超算TOP500榜單中,中國超算在性能、技術(shù)排名上都全球領(lǐng)先。 第三,HPC得到了中國政府的高度重視,無論早前政府工作報(bào)告中提及的“互聯(lián)網(wǎng)+行動(dòng)計(jì)劃”、“大數(shù)據(jù)發(fā)展行動(dòng)綱要”還是今年提出的“新經(jīng)濟(jì)”以及旨在調(diào)整經(jīng)濟(jì)結(jié)構(gòu)的“供給側(cè)改革”等新舉措,都將對高性能計(jì)算的發(fā)展起到有力的推動(dòng)作用。 隨著戴爾中國4.0新戰(zhàn)略的起航,其“在中國,為中國”的理念將使得它未來的發(fā)展計(jì)劃與中國經(jīng)濟(jì)發(fā)展和國家政策緊密結(jié)合。同時(shí),戴爾不斷融入中國本土的IT生態(tài)系統(tǒng),這都對戴爾HPC在中國的發(fā)展,起到了重要的助推作用。 例如,去年11月份,戴爾和中國科學(xué)院自動(dòng)化研究所合作共同建設(shè)“人工智能與先進(jìn)計(jì)算聯(lián)合實(shí)驗(yàn)室”,就是戴爾中國4.0發(fā)展戰(zhàn)略的具體體現(xiàn),而戴爾助力中國人工智能領(lǐng)域的科技創(chuàng)新,也獲得外界的認(rèn)可。在HPC China 2016上,中國計(jì)算機(jī)協(xié)會高性能計(jì)算專業(yè)委員會為戴爾,頒發(fā)了“人工智能技術(shù)實(shí)踐創(chuàng)新獎(jiǎng)”。
“開箱即用”HPC新理念
值得一提的是,秉承高性能計(jì)算“民眾化”價(jià)值新主張,戴爾向HPC市場推出了一系列的“HPC Systems”家族,希望在生命科學(xué)、制造及教育科研領(lǐng)域向用戶提供“開箱即用”的HPC系統(tǒng),也可以稱之為“HPC即服務(wù)”。
面向行業(yè)和新一代超算應(yīng)用的"3+2"解決方案: 第一,針對生命科學(xué)行業(yè)需求而設(shè)計(jì)的戴爾HPC系統(tǒng),可幫助生物信息學(xué)中心和遺傳學(xué)中心,根據(jù)臨床要求的時(shí)限交付結(jié)果并確定治療方案,同時(shí)確保合規(guī)并保護(hù)機(jī)密數(shù)據(jù)。 它完全集成式的HPC解決方案,包括了戴爾的Networking、PowerEdge 和 PowerVault產(chǎn)品組合,支持研究人員和臨床人員利用易于部署、基于開放標(biāo)準(zhǔn)的架構(gòu),更快地獲得洞察力。 第二,針對制造行業(yè)設(shè)計(jì)的戴爾HPC系統(tǒng),可幫助制造和工程客戶運(yùn)行復(fù)雜的設(shè)計(jì)仿真軟件,包括結(jié)構(gòu)分析和計(jì)算流體力學(xué)分析。 在這套HPC系統(tǒng)中,戴爾與眾不同之處在于它預(yù)先調(diào)整了為特定應(yīng)用程序集的系統(tǒng)優(yōu)化設(shè)計(jì),眾多專業(yè)應(yīng)用軟件都在這套系統(tǒng)上提到做了驗(yàn)證,包括ANSYS力學(xué)、CD-Adapco、電子設(shè)計(jì)自動(dòng)化(EDA)。 第三,針對科研教育行業(yè)設(shè)計(jì)的戴爾HPC系統(tǒng),這是一套可幫助科研、教育機(jī)構(gòu)根據(jù)各種工作負(fù)載的獨(dú)特需求快速開發(fā)的HPC系統(tǒng),以方便用戶開展復(fù)雜的科學(xué)分析。 在這套HPC系統(tǒng)中,戴爾的獨(dú)特優(yōu)勢體現(xiàn)在提供了同類最佳解決方案,包含在性能、密度、能效和功能方面處于業(yè)界領(lǐng)先地位的產(chǎn)品;模塊化設(shè)計(jì)可根據(jù)用戶的具體工作負(fù)載自定義系統(tǒng)。 除此之外,戴爾還強(qiáng)化了超算在存儲環(huán)節(jié)的產(chǎn)品力度。我們知道,在HPC中,計(jì)算部分的能力越來越強(qiáng),存儲也必須與時(shí)俱進(jìn)。所以,HPC如今最關(guān)心的問題往往是處理器算得這么快,存儲是不是能跟得上?同時(shí),數(shù)據(jù)量越來越大,IO往往成為瓶頸,這都需要一套可靠的存儲架構(gòu)來做支撐。 基于此,戴爾推出了高可用的Dell HPC NFS存儲方案,全套NFS解決方案構(gòu)建在久經(jīng)考驗(yàn)的戴爾硬件基礎(chǔ)之上;在單個(gè)命名空間,可從最小48TB擴(kuò)展至480TB的原始容量;配置100GB Intel OPA網(wǎng)絡(luò),可實(shí)現(xiàn)1.85 GB/s的寫性能,6.5 GB/s的讀性能;同時(shí),戴爾還調(diào)整和配置最佳做法,實(shí)現(xiàn)了30%的性能提高。 不僅如此,戴爾還提供了Intel Lustre的Dell HPC高性能存儲方案。Intel Lustre是一種開源的分布式文件系統(tǒng),同時(shí)也是并行文件系統(tǒng)。它的優(yōu)勢包括提供單一命名空間;可增加節(jié)點(diǎn)數(shù)來擴(kuò)展容量和性能,并支持在線擴(kuò)展;支持多個(gè)客戶端并發(fā)讀/寫,通過分布式鎖機(jī)制保障數(shù)據(jù)一致性等。 在這套分布式文件系統(tǒng)上,戴爾借助Intel Lustre動(dòng)態(tài)存儲擴(kuò)展功能,讓“每構(gòu)建塊”的峰值達(dá)到 18.5GB/s 讀取速率和 15.1 GB/s 寫入速率。
軟硬兩翼齊飛新策略
當(dāng)然,戴爾除了在HPC硬件層面不斷發(fā)力之外,在軟件層面同樣堅(jiān)持“開源、開放、融合”的策略,由此實(shí)現(xiàn)了HPC“軟硬兼施”的兩翼齊飛,具體表現(xiàn)在:
其一,不斷打磨高性能計(jì)算運(yùn)維管理軟件,和硬件投入相比,HPC日常管理也屬于“剛需”。特別是對于大部分商業(yè)化機(jī)構(gòu)來說,實(shí)現(xiàn)HPC時(shí)時(shí)監(jiān)控與日常系統(tǒng)運(yùn)維,都是擺在上述用戶面前的關(guān)鍵性問題。 在這方面,戴爾和Bright Computing展開深入合作,通過Cluster Manager單一易用的圖形用戶界面進(jìn)行超算系統(tǒng)的管理。此外Cluster Manager集群管理平臺,以極高的效率和單守護(hù)進(jìn)程,最大限度地降低了超算管理的成本,最大限度地提高系統(tǒng)的吞吐量,提升了系統(tǒng)的整體性能。 其二,為滿足用戶對開源軟件的新需求,戴爾繼續(xù)強(qiáng)化了和Bright Computing公司的合作,在大數(shù)據(jù)Hadoop、私有云管理平臺Openstack以及深度學(xué)習(xí)領(lǐng)域的共同研發(fā)合作。特別是戴爾分布式深度學(xué)習(xí)方案,可選的機(jī)器學(xué)習(xí)框架就有Caffe、Torch、Tensorflow、Theano;可選的機(jī)器學(xué)習(xí)庫包括MLPython、cuDNN、DIGITS和CaffeOnSpark。 其三,戴爾對OpenHPC項(xiàng)目同樣非常重視,這不僅是因?yàn)榇鳡柺荗penHPC創(chuàng)始成員之一,更為關(guān)鍵的是,戴爾相信開源的普及不僅流行于企業(yè)級市場的今天,也將是HPC市場的明天,由此戴爾必須對此有所準(zhǔn)備。 最后,戴爾在北京建立了高性能計(jì)算創(chuàng)新實(shí)驗(yàn)室,可幫助中國的用戶實(shí)現(xiàn)軟硬件的測試、驗(yàn)證和創(chuàng)新,迄今為止安裝測試過的平臺軟件包括:CentOS、Redhat Linux、Altair PBSworks、Intel Enterprise Lustre、聯(lián)科集團(tuán)的CHESS、并行科技的Paraplus、藍(lán)海彤翔的COMS以及OpenHPC。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。