NVIDIA 144核心超級CPU揭秘:3.5倍能效碾壓AMD 128核心


2022年3月的GTC技術大會上,NVIDIA正式發佈首款數據中心CPU——Grace,同時打造兩顆超級芯片,一是GraceCPU二合一,二是GraceCPU+HopperGPU二合一。現在,NVIDIA官方詳細揭示GraceSuperchip超級芯片的設計與性能、能效。

Grace CPU二合一

Grace CPU+Hopper GPU二合一

它通過NVLink-C2C芯片間互連總線,將兩顆Grace CPU整合在一塊基板上,彼此之間的雙向帶寬多達900GB/s。

Grace CPU基於Armv9-A 9.0架構、Neoverse V2 64位內核,以4個128-bit功能單元的方式配置兩組SIMD矢量指令集,一是SVE 2(縮放矢量擴展第二版),二是NEON(高級SIMD)。

它還支持LSE(大型系統擴展),可提供低成本的原子操作,改進CPU通信吞吐。

NVIDIA聲稱,這種核心的能效,是如今服務器常見x86核心的2倍。

Grace CPU單顆集成72個核心,互相通過3.2TB/s超高帶寬的NVIDIA縮放一致性Fabric總線互連,而二合一的超級芯片上就是144個核心。

每核心64KB一級指令緩存、64KB一級數據緩存、1MB二級緩存,一顆超級芯片的所有核心共享234MB三級緩存。

內存整合封裝LPDDR5X,最大容量960GB,最高帶寬1TB/s(每一顆500GB/s),還支持ECC。

對比傳統的八通道DDR5,這種設計不但帶寬高出53%,單位功耗也隻有1/8。

對比海量帶寬的HBM2e,單位成本隻有1/3,容量則可達8倍。

擴展支持八組PCIe 5.0 x16,總帶寬1TB/s,還有用於管理的低速PCIe通道。

性能方面,一顆超級芯片的FP64雙精度峰值浮點性能可達7.1TFlops(每秒7.1萬億次計算),熱設計功耗500W。

NVIDIA對比AMD Zen3架構的霄龍7763 64核心,雙路組成128核心,號稱性能可領先1.5-2.5倍,能效可領先2.0-3.5倍!

當然,AMD已經有Zen4架構、最多96核心的霄龍9004系列,NVIDIA Grace依然還沒有商用。


相關推薦

2023-12-07

成式AI的強勁需求。Instinct MI300X:1920億晶體管怪獸 完勝NVIDIA H100Instinct MI300X屬於傳統的GPU加速器方案,純粹的GPU設計,基於最新一代CDNA3計算架構。它集成八個XCD加速計算模塊(Accelerator Compute Die),每一個XCD擁有38個CU計算單元,

2022-08-22

在自研CPU上,NVIDIA去年就公佈GraceCPU服務器處理器,這是一款高達144核的ARM處理器,日前在hotchips會議上NVIDIA又公佈Grace的架構細節及跑分,SPECrate2017_int_base最高可達740分,不僅超過AMD及Intel的x86旗艦,也超過前不久拿下第一的阿

2023-05-15

、物聯網、AR/VR 、HPC及數據中心領域。其中就包括基於雙核心和四核心架構設計的 Vega CPU 系列,主要針對需要低功耗和低成本芯片的入門級客戶,將涵蓋印度至少 10% 的芯片需求。該機構還計劃在未來 3 年內推出八核心的芯片,

2022-08-20

HotChips年度芯片行業盛會將在本月底舉行,Intel、AMD、NVIDIA和眾多業內芯片巨頭都將拿出各傢的拳頭產品,秀秀肌肉。NVIDIA這次會有多場分享,重點覆蓋HopperGPU計算加速器、GraceCPU服務器處理器、NVLink高速總線,屆時會有多位高級

2023-03-13

電7nm工藝制造,集成87.86億個晶體管,Arm架構,集成52個核心,包括48個計算核心(分為四組每組8MB二級緩存)、4個結構管理核心,主頻2.2GHz,並集成HBM2高帶寬內存。富嶽超算一共用近16萬顆A64FX處理器,總核心數量多達7630848個。去

2023-02-03

多達瘋狂的1460億個!它同時集成CDNA3架構的GPU單元(具體核心數量未公開)、Zen4架構的24個CPU核心、大容量的Infinity Cache無限緩存,還有8192-bit位寬、128GB容量的HBM3高帶寬內存。技術方面支持第四代Infinity Fabric總線、CXL 3.0總線、統

2022-09-20

已有多傢合作夥伴正在V2的基礎上設計芯片方案。其中,NVIDIA第一款數據中心處理器Grace就利用V2核心作為計算基礎,並結合最大512GB LPDDR5X內存,每瓦性能比傳統架構的服務器高出多達2倍。NVIDIA Grace號稱超級芯片(SuperChip),臺積

2022-07-01

改名,首要原因就是第一次支持基於硬件的光線追蹤,和NVIDIA、AMD、Intel的高性能顯卡一樣進入瞭光追時代。當然,Arm GPU不是第一個支持光追的移動端產品,Imagination此前已經做到,但是兩傢的影響力不可同日而語,Imagination的

2023-05-28

新的2.06正式版,更新力度相當大,除增加支持Intel、AMD、NVIDIA的新硬件,還特別豐富對x86架構兆芯處理器的支持。CPU-Z 2.06現已正式支持兆芯開先KX-6000G/4及其集成GPU C-1080、開勝KH-40000,二者都是去年11月發佈的。開先KX-6000G/4面向

2024-03-08

學。20 多年前最好的消費級顯卡,例如 3dfx Voodoo5 5500和 NVIDIA GeForce 2 Ultra,都是出色的 SIMD 設備。然而,它們的創建目的是為遊戲生成 3D 圖形,而不是其他任何東西。即使是專業市場的顯卡也隻專註於渲染。ATI 售價 2,000 美元的

2022-10-16

器和數據中心,代號Genoa,也就是霄龍9004系列,最多達96核心192線程。曝料大神MLIS現在公佈霄龍9004系列的完整型號、規格,甚至還有官方性能。頂級型號霄龍9654(單路版本霄龍9654P),96核心(12個CCD),384MB三級緩存,基準頻率2.05-2

2023-03-30

ntel 7制造工藝,架構上也不會有本質的變化,重點是增加核心數量、提升能效。封裝接口也延續LGA4677,現有平臺可以無縫升級。再往後,Intel就要借鑒12/13代酷睿引入的混合架構,但不是雙重架構,兩條腿走路。一是針對性能優

2023-03-07

還是服務器級霄龍,CCD部分都是臺積電5nm工藝,最多8個核心。其中,銳龍有1-2個CCD,核心數6-16個;霄龍有2-12個CCD,核心數16-96個。IOD都是臺積電6nm工藝,但銳龍、霄龍搭檔的截然不同。銳龍這裡的尺寸隻有12.4x9.5=117.8平方毫米

2023-11-16

年大幅增加39%之多。如此進步,歷年罕見。AMD EPYC 7A53 64核心處理器、Instinct MI250X GPU加速器組成的頂級超算“Frontier”繼續穩居榜首,並實現霸氣的四連冠,依然是迄今唯一一套公開的完全通過驗證並投入實用的百億億次級超算