日前,飛騰已經(jīng)完成FT-2000plus服務(wù)器CPU的研制工作,飛騰公司的合作伙伴正在積極研發(fā)相應(yīng)的整機(jī)產(chǎn)品。FT-2000plus這款是以FT2000為基礎(chǔ)的改進(jìn)版本,雖然在單核性能上和Intel還存在一定差距,但在多核性能上,已經(jīng)達(dá)到Intel服務(wù)器CPUE5主流產(chǎn)品的水平。
據(jù)傳,國防科大正在研發(fā)的1000P超算天河3號(性能指標(biāo)是神威太湖之光的8倍),其原型機(jī)的CPU或?qū)⒉捎肍T-2000或其后繼產(chǎn)品作為主控CPU。考慮到在天河2A上,國防科大已經(jīng)用自主研發(fā)的加速器矩陣2000取代Intel的XeonPhi計(jì)算卡。從今往后,天河系列超算也將和神威系列超算一樣,徹底告別國外CPU或加速器,實(shí)現(xiàn)芯片的全國產(chǎn)化。
FT-2000系列芯片是厚積薄發(fā)的結(jié)果
近年來,國內(nèi)某些企業(yè)熱衷于“走捷徑”,先后與Intel、IBM、ARM、高通等國外芯片巨頭技術(shù)合作或合資,有的公司把國外的CPUIP授權(quán)買回來做集成,就宣傳是自主知識產(chǎn)權(quán),甚至還有公司將國外的芯片包裝一下變成國產(chǎn)芯片。
雖然這種走捷徑的做法可以在短時(shí)間內(nèi)拿出性能不錯(cuò)的芯片,但由于國外公司始終懷有“教會(huì)徒弟、餓死師傅”心理,不會(huì)將最先進(jìn)的技術(shù)授權(quán)給中國,而且國內(nèi)單位在拿到國外技術(shù)授權(quán)后,容易陷入知其然,不知其所以然的困境,不具備技術(shù)發(fā)展的可持續(xù)性,在國外公司開發(fā)出下一代產(chǎn)品之后,只能再次引進(jìn)國外技術(shù)。
相比之下,飛騰選擇了較為困難的自主研發(fā)道路,雖然發(fā)展會(huì)慢一些,但更具后勁。早在十多年前,飛騰就基于IA-64指令集設(shè)計(jì)CPU,之后又以Sparc開源代碼為基礎(chǔ)設(shè)計(jì)了FT-1000和FT-1500兩款CPU,F(xiàn)T-1000被用于天河1號超算,F(xiàn)T-1500被用于天河2號超算。在2012年前后,飛騰選擇了ARM陣營,獲得了ARM指令集授權(quán),可以基于ARM64指令集設(shè)計(jì)自己的CPU。并在數(shù)年時(shí)間里先后開發(fā)出了FTC660、FTC661兩款CPU核,以及FT-1500A/4、FT-1500A/16、FT-2000、FT-2000plus等CPU。
FT-1500A/4被用于PC和筆記本,采用28nm制造工藝。集成了4個(gè)FTC660CPU核,主頻1.5GHz—2.0GHz,集成了2MB二級cache和8MB三級cache,集成了2個(gè)DDR3-1600存儲(chǔ)控制器,可提供25.6GB/s訪存帶寬,最大功耗為15W。
FT-1500A/16被用于服務(wù)器,采用28nm制造工藝。集成了16個(gè)FTC660CPU核,主頻1.5GHz,集成了8MB二級cache和8MB三級cache,集成了4個(gè)DDR3-1600存儲(chǔ)控制器,可提供51.2GB/s訪存帶寬,最大功耗為35W。
FT-2000采用28nm制造工藝,可被用于超算計(jì)算節(jié)點(diǎn)和高性能服務(wù)器。集成了64個(gè)FTC661處理器核。工作主頻1.5GHz—2.0GHz。集成了32MB二級cache,擴(kuò)展支持128MB三級cache。支持16個(gè)DDR3-1600存儲(chǔ)控制器,可提供204.8GB/s訪存帶寬。
最新的FT-2000Plus采用了臺(tái)積電16nm制造工藝,主頻為2.0GHz—2.4GHz,集成了64個(gè)FTC661處理器核。為了提高集成度,拋棄了L3cache,將DDR4內(nèi)存控制器集成到了片內(nèi)。目前,飛騰系列CPU已經(jīng)形成了一個(gè)家族,可滿足黨政軍多個(gè)領(lǐng)域的實(shí)際需求。
足以和Intel主流服務(wù)器抗衡CPU在國內(nèi)ARM服務(wù)器CPU中處于領(lǐng)跑位置
根據(jù)實(shí)際測試FT-2000在2GHz主頻下,采用GCC4.8編譯器,SPEC2006的測試成績分別為SPECint_rate2006:570、SPECfp_rate2006:482,與IntelXeonE5-2695v3相當(dāng)。
而最新的FT-2000Plus因?yàn)閯h除了L3導(dǎo)致在SPEC測試中某些子項(xiàng)分?jǐn)?shù)下降,把集成DDR4等改進(jìn)帶來的提升抹平了,使FT-2000Plus在同主頻下與FT-2000的性能相差不大。那飛騰公司為何要這么做呢?原因應(yīng)該是為了商業(yè)化,提高FT-2000plus的集成度可以方便主機(jī)廠,降低開發(fā)FT-2000plus整機(jī)產(chǎn)品的成本。不過,在使用了更好的臺(tái)積電16nm制造工藝之后主頻可以最高穩(wěn)定到2.4G,使FT-2000plus相對于FT-2000還是有不小的性能提升,能夠滿足高端服務(wù)器和超算主控CPU的性能要求。
近年來,不少廠家都開始著手開發(fā)ARM服務(wù)器CPU。在國內(nèi),華為和華芯通也在著手開發(fā)ARM服務(wù)器CPU。不過,就目前而言,飛騰的ARM服務(wù)器CPU在性能上處于絕對領(lǐng)先地位。
華芯通是中國大陸與高通成立的合資公司,從高通手中獲得了源碼并基于該源碼設(shè)計(jì)自己的CPU。不過,由于華芯通北京研發(fā)中心啟用時(shí)日尚短,正式商用產(chǎn)品問世尚需時(shí)日。
相比之下,華為研發(fā)ARM服務(wù)器CPU的時(shí)間要早得多,而且在北京和美國都有研發(fā)中心,已經(jīng)有產(chǎn)品Hi1612問世。雖然在宣傳上,華為聲稱Hi1612是“自主研發(fā)”,“除存儲(chǔ)單元外均具有完整知識產(chǎn)品”,但其實(shí)上,這款服務(wù)器CPU采用臺(tái)積電16nm制造工藝,其內(nèi)核是ARMCortexA57。
而且Hi1612的性能也比較一般,也許是因?yàn)槿A為缺乏服務(wù)器CPU設(shè)計(jì)經(jīng)驗(yàn),這款服務(wù)器CPU的性能相對有限,以飛騰的FT2000作參照,華為的這款服務(wù)器CPU在制造工藝領(lǐng)先2代的情況下,以FT2000一半的功耗實(shí)現(xiàn)了不足FT2000一半的性能。
不過,據(jù)小道消息,華為的下一款A(yù)RM服務(wù)器正在研發(fā)中,而且位于龍芯公司斜對門的華為北京研發(fā)中心已經(jīng)拿ARMCortexA72修改了至少2個(gè)版本(華為有錢,買了ARM的“大禮包”),加上位于美國的研發(fā)中心可以提供技術(shù)支持,在有ARMCortexA72為基礎(chǔ)的情況下,華為的下一款A(yù)RM服務(wù)器CPU的性能值得期待。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。