7月29日,IBM針對金融業(yè)和關(guān)鍵業(yè)務領域發(fā)布了System zEnterprise 196大型機(前一代是z10),在宣講了很多架構(gòu)優(yōu)勢和多樣性技術(shù)之后,IBM并沒有透露更多z系列新四核處理器的規(guī)格信息,唯一談到的技術(shù)點就是該大型機的處理器主頻為5.2GHZ,且是全球最快的微處理器。
雖然IBM的高管對于公司硬件的運行速度和某些特定性能等信息都比較敏感,不愿多透露詳細信息。但近日我們通過國外媒體挖掘出有關(guān)z系列大型機中獨特的Z處理器的有關(guān)細節(jié),與眾位讀者分享這神秘處理器的獨特設計。
四核Z196處理器和4.4Ghz的四核Z10處理器有某些相似之處。不過,Z196處理器采用的是45nm制作工藝(Z10芯片采用的是65nm ),這意味著IBM可以將更多的應用集成到這個芯片上,類似于早先發(fā)布的8核Power 7。
據(jù)了解,Z196處理器有14億個晶體管,面積為512.3平方毫米,這使其在晶體管數(shù)量和面積上都要大于POWER7芯片。z196芯片采用了IBM的觸點陳列封裝,被稱為C4的金屬觸點封裝取代了以往的針狀插腳——其觸點數(shù)量驚人:8093個電源觸電和1134個信號觸點。
z196芯片和Z10的一樣,每個核心都有64KB的L1指令緩存和128KB的L1數(shù)據(jù)緩存,這一點非常相似。但是z196有100個新指令和超標量通道允許指令重新排序,這樣Z196通道就比z10的更有效,而且其編輯代碼是不可見的。除此之外,Z196的每個核心都有1.5MB的L2緩存。下面是z196的芯片架構(gòu)圖:1
z196引擎的超標量通道可以在每個時鐘周期內(nèi)解碼3個z/Architecture CISC指令并執(zhí)行多達5個操作。每個核心有6個執(zhí)行單元:2個整數(shù)單元,1個浮點單元,2個加載/保存單元和1個小數(shù)單元。IBM表示,這個浮點單元要比z10芯片中的更好,但是并沒有透露它在每個時鐘周期內(nèi)可以做多少flops。z/Architecture CISC中的一些優(yōu)先級別高的指令被分割成塊,這不僅使得通道的使用更高效,還讓z196更像RISCy。
與POWER7芯片一樣,z196在芯片中采用嵌入式的DRAMceDRAM)作為L3緩存。這種eDRAM比經(jīng)常用作緩存的靜態(tài)DRAM(SRAM)速度更慢,但是你可以將信息其指定到特定的區(qū)域。對很多工作負載來說,芯片可用調(diào)用內(nèi)存的大小比高速度內(nèi)存更重要?;谶@點考慮,z196處理器設計了24 MB的eDRAM L3緩存,每個緩存劃分為2個存儲體,并由2個片上L3緩存控制器進行管理。
每個z196芯片可以作為一個GX I/O總線控制器——這種方法同樣被用于POWER系列芯片中,用于連接主機通道適配器和其他外圍設備,每個插槽分配得到一個與受RAID保護的DDR3主內(nèi)存相連接的內(nèi)存控制器。此外,z196芯片還有2個加密和壓縮處理器,IBM大型機將采用了這種第三代電路設計。
z196芯片采用兩個核心共享其中一個協(xié)同處理器方式,且每個核心有16KB的緩存空間。最終達到每個z196芯片有一個可連接SMP Hub/共享緩存芯片接口。如下圖所示,有2個芯片被集成到一個z196多芯片模塊(MCM)上,提供了交叉耦合允許MCM上所有6個插槽通過40GB/s相連接。Z196提供的交叉耦合訪問方式,在MCM上提供了六個插槽以40GB/s的速度連接到各芯片上。
在IBM大型機中,z196處理引擎相當于中央處理器(CP),而CP的互連芯片稱為共享緩存(SC)。每個SC有6個CP接口相互連接,其中有3個架構(gòu)接口連接到全加載的z196系統(tǒng)中其他3個MCM。
從上面的架構(gòu)圖來看,SMP Hub的一個優(yōu)點就是可以加載到帶有L4緩存的組件上,這是大多數(shù)服務器所沒有的功能——幾年前IBM曾向至強處理器的EXA芯片組上增加了一些L4緩存。L4緩存之所以重要,其原因在于大型機引擎的主頻要遠高于主內(nèi)存速度,但是如果只通過增加一個緩存層來滿足Z196的引擎需求是非常昂貴的。不管怎樣,這種SMP Hub/共享緩存芯片和CP一樣也是采用45nm制程工藝,有15億個晶體管,面積為478.8平方毫米,封裝中有8919個觸點。
每個MCM上部署6個CP和2個SC,MCM是一個邊長96毫米的正方形,功耗1880瓦。每個處理器板有一個MCM,這使得一個完全連接的系統(tǒng)可以達到96個CP,十幾個控制器可以訪問多達3TB RAID內(nèi)存,32個I/O Hub接口最高可實現(xiàn)288 GB/s的I/O帶寬。頂架式zEnterprise 196 M80設備中的80個CP可用于運行工作負載,其他可以使用Parallel Sysplex集群來耦合系統(tǒng)、管理I/O和熱備份等等。(來源:CNW.com.cn)