NVIDIA 144核心超級CPU揭秘：3.5倍能效碾壓AMD 128核心

2023-01-21 來自快科技發表於業界精選

2022年3月的GTC技術大會上，NVIDIA正式發佈首款數據中心CPU——Grace，同時打造兩顆超級芯片，一是GraceCPU二合一，二是GraceCPU＋HopperGPU二合一。現在，NVIDIA官方詳細揭示GraceSuperchip超級芯片的設計與性能、能效。

Grace CPU二合一

Grace CPU＋Hopper GPU二合一

它通過NVLink-C2C芯片間互連總線，將兩顆Grace CPU整合在一塊基板上，彼此之間的雙向帶寬多達900GB/s。

Grace CPU基於Armv9-A 9.0架構、Neoverse V2 64位內核，以4個128-bit功能單元的方式配置兩組SIMD矢量指令集，一是SVE 2(縮放矢量擴展第二版)，二是NEON(高級SIMD)。

它還支持LSE(大型系統擴展)，可提供低成本的原子操作，改進CPU通信吞吐。

NVIDIA聲稱，這種核心的能效，是如今服務器常見x86核心的2倍。

Grace CPU單顆集成72個核心，互相通過3.2TB/s超高帶寬的NVIDIA縮放一致性Fabric總線互連，而二合一的超級芯片上就是144個核心。

每核心64KB一級指令緩存、64KB一級數據緩存、1MB二級緩存，一顆超級芯片的所有核心共享234MB三級緩存。

內存整合封裝LPDDR5X，最大容量960GB，最高帶寬1TB/s(每一顆500GB/s)，還支持ECC。

對比傳統的八通道DDR5，這種設計不但帶寬高出53％，單位功耗也隻有1/8。

對比海量帶寬的HBM2e，單位成本隻有1/3，容量則可達8倍。

擴展支持八組PCIe 5.0 x16，總帶寬1TB/s，還有用於管理的低速PCIe通道。

性能方面，一顆超級芯片的FP64雙精度峰值浮點性能可達7.1TFlops(每秒7.1萬億次計算)，熱設計功耗500W。

NVIDIA對比AMD Zen3架構的霄龍7763 64核心，雙路組成128核心，號稱性能可領先1.5-2.5倍，能效可領先2.0-3.5倍！

當然，AMD已經有Zen4架構、最多96核心的霄龍9004系列，NVIDIA Grace依然還沒有商用。

相關推薦