計(jì)算產(chǎn)業(yè)正在迎來一場(chǎng)智能化的變革,AI普及驅(qū)動(dòng)服務(wù)器產(chǎn)品升級(jí)。同時(shí),服務(wù)器及數(shù)據(jù)中心的智能化管理和運(yùn)維也成為大勢(shì)所趨。
智能時(shí)代,人工智能與實(shí)體經(jīng)濟(jì)深度融合,算力的重要性不言而喻。不管是人工智能技術(shù)本身的進(jìn)步還是企業(yè)的數(shù)字化變革都離不開計(jì)算力的支撐。而另一方面,計(jì)算本身也深受人工智能技術(shù)的影響,在計(jì)算產(chǎn)業(yè)的各個(gè)環(huán)節(jié),包括基礎(chǔ)設(shè)施、運(yùn)營(yíng)以及管理等各個(gè)方面,都能看到人工智能的“身影”。
智能計(jì)算與加速
根據(jù)OpenAI最新的分析,近年來人工智能訓(xùn)練任務(wù)所需求的算力每3.43個(gè)月就會(huì)翻倍,這一數(shù)字大大超越了芯片產(chǎn)業(yè)長(zhǎng)期存在的摩爾定律(每18個(gè)月芯片的性能翻一倍)。自2012至2018的6年時(shí)間里,業(yè)界對(duì)于算力的需求增長(zhǎng)了超過300000倍。
AI、5G、物聯(lián)網(wǎng)等不同類型工作負(fù)載帶來了計(jì)算的多樣性趨勢(shì),如何組合不同的計(jì)算資源高效地應(yīng)對(duì)不同的計(jì)算需求,是提升計(jì)算ROI的關(guān)鍵。特別是AI的廣泛應(yīng)用對(duì)算力需求增長(zhǎng)不斷加快,而CPU技術(shù)的提升已經(jīng)遭遇瓶頸,隨著摩爾定律逐漸失效,我們必須依靠多種計(jì)算架構(gòu)的組合解決算力瓶頸,以應(yīng)對(duì)AI負(fù)載的增長(zhǎng)。
未來的世界會(huì)是一個(gè)開放的、多元化的世界,而標(biāo)準(zhǔn)化的計(jì)算平臺(tái)已經(jīng)無法滿足數(shù)字化技術(shù)對(duì)計(jì)算的要求。為了應(yīng)對(duì)算力爆炸的趨勢(shì),AI服務(wù)器引入了智能加速引擎,包含了GPU、FPGA加速卡、智能融合網(wǎng)卡和推理卡加速部件,突破傳統(tǒng)服務(wù)器單機(jī)性能過度依賴CPU,大幅度提升服務(wù)器的系統(tǒng)級(jí)性能。
隨著應(yīng)用和數(shù)據(jù)的多樣化,計(jì)算平臺(tái)呈現(xiàn)出向異構(gòu)計(jì)算演進(jìn)的趨勢(shì),異構(gòu)計(jì)算芯片大規(guī)模于眾多應(yīng)用場(chǎng)景中。在“成就智慧計(jì)算”的戰(zhàn)略下,新華三提供了CPU、GPU、FPGA、ASIC等多種強(qiáng)大的計(jì)算能力,滿足智能化計(jì)算的所有場(chǎng)景,加速百行百業(yè)數(shù)字化變革。
新華三服務(wù)器產(chǎn)品不光集成了對(duì)異構(gòu)計(jì)算的支持,還搭載了新華三自主研發(fā)的人工智能平臺(tái)AIOS,AIOS能夠幫助用戶實(shí)現(xiàn)AI的部署、池化、管理、推理、訓(xùn)練等各個(gè)環(huán)節(jié)的人工智能落地整體解決方案。
AI計(jì)算已經(jīng)成為主流的計(jì)算形態(tài),并對(duì)人工智能服務(wù)器市場(chǎng)產(chǎn)生重要影響。根據(jù)IDC的數(shù)據(jù),2019年中國(guó)AI服務(wù)器出貨量為79318臺(tái),同比增長(zhǎng)46.7%。2019年人工智能基礎(chǔ)架構(gòu)市場(chǎng)規(guī)模達(dá)到20.9億美元,同比增長(zhǎng)58.7%。中國(guó)AI服務(wù)器市場(chǎng)在2018-2023年的年復(fù)合增長(zhǎng)率為37.9%,也就是到2023年,AI服務(wù)器市場(chǎng)規(guī)模將達(dá)到2019年的3.6倍。
AI服務(wù)器不僅出貨量增長(zhǎng)速度更高、技術(shù)創(chuàng)新更快,而且單機(jī)配置也在不斷提高,單臺(tái)AI服務(wù)器可以提供更高的計(jì)算力。當(dāng)前人工智能服務(wù)器正在快速成熟和完善中,如果結(jié)合整個(gè)人工智能技術(shù)和服務(wù)的發(fā)展,我們看到未來人工智能服務(wù)器會(huì)重點(diǎn)在低功耗設(shè)計(jì)、智能邊緣計(jì)算、軟硬件平臺(tái)融合等領(lǐng)域產(chǎn)生新的突破。
智能管理與運(yùn)維
具備支撐AI計(jì)算的服務(wù)器產(chǎn)品是計(jì)算產(chǎn)業(yè)智能化升級(jí)的一個(gè)方面,另外不管是服務(wù)器產(chǎn)品還是數(shù)據(jù)中心實(shí)現(xiàn)智能化管理和運(yùn)維也是AI賦能的重要體現(xiàn)。
隨著算力需求的增加,數(shù)據(jù)中心建設(shè)規(guī)模越來越大,從幾萬臺(tái)服務(wù)器到幾十萬甚至上百萬。這就需要IT基礎(chǔ)設(shè)施具備快速部署、快速上線及便捷管理的能力,海量服務(wù)器的管理場(chǎng)景變得越來越復(fù)雜,傳統(tǒng)運(yùn)維領(lǐng)域面臨許多新的挑戰(zhàn)。
眾所周知,傳統(tǒng)數(shù)據(jù)中心主要依靠人工操作來解決日常運(yùn)維問題,人力不僅低效而且穩(wěn)定性不高,造成海量服務(wù)器的部署、運(yùn)維、管理成本高昂。此外,傳統(tǒng)運(yùn)維模式中,運(yùn)維人員主要是被動(dòng)式地等待問題發(fā)生,再進(jìn)行故障處理,傳統(tǒng)運(yùn)維模式下人均維護(hù)效率為50-100臺(tái)。隨著數(shù)據(jù)中心規(guī)模越來越大,故障將發(fā)生地更加頻繁,故障之間的關(guān)聯(lián)將更加復(fù)雜,傳統(tǒng)的維護(hù)效率會(huì)進(jìn)一步降低。
AI時(shí)代,數(shù)據(jù)中心服務(wù)器越來越多承載大數(shù)據(jù)、人工智能等業(yè)務(wù)場(chǎng)景,數(shù)據(jù)中心自身也需要適應(yīng)新的智能化業(yè)務(wù)的需求。智能化數(shù)據(jù)中心的建設(shè)應(yīng)該是基于海量數(shù)據(jù),利用人工智能的技術(shù),將人工總結(jié)運(yùn)維規(guī)則的過程變?yōu)樽詣?dòng)學(xué)習(xí)的過程,實(shí)現(xiàn)智能化的故障發(fā)現(xiàn)、診斷、處置、預(yù)防。
Gartner于2016年提出了智能運(yùn)維的概念(Algorithmic IT Operations,AIOps),相比人工運(yùn)維中的不足,智能運(yùn)維管理不僅能夠簡(jiǎn)化流程、提高效率以及綜合管理能力,也能大大降低人為產(chǎn)生的故障率,未來數(shù)據(jù)中心智能管理必將全面替代純?nèi)斯み\(yùn)維及自動(dòng)化半人工運(yùn)維。
例如新華三創(chuàng)新性地推出了U-Center統(tǒng)一運(yùn)維平臺(tái),變被動(dòng)響應(yīng)式監(jiān)測(cè)為自動(dòng)智能運(yùn)維,通過AI和運(yùn)維的結(jié)合,80%以上系統(tǒng)的問題不需要人工干預(yù)自動(dòng)解決。未來甚至能夠在計(jì)算資源或者網(wǎng)絡(luò)資源、存儲(chǔ)資源遇到瓶頸時(shí)給用戶建議,在出現(xiàn)瓶頸之前盡快部署資源幫助解決用戶的問題。
此外,智能服務(wù)器通過增加AI智能管理引擎,可提供包含資產(chǎn)管理、能效管理、部署管理、故障管理等智能管理特性,讓海量部署的服務(wù)器管理更加智能化,提升管理與運(yùn)維效率。數(shù)據(jù)中心通過將傳統(tǒng)服務(wù)器升級(jí)為智能服務(wù)器,實(shí)現(xiàn)由點(diǎn)到面的算力進(jìn)化,最終實(shí)現(xiàn)無人值守的自動(dòng)化、智能化數(shù)據(jù)中心基礎(chǔ)設(shè)施。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。