2022年3月的GTC技術大會上,NVIDIA正式發佈首款數據中心CPU——Grace,同時打造兩顆超級芯片,一是GraceCPU二合一,二是GraceCPU+HopperGPU二合一。現在,NVIDIA官方詳細揭示GraceSuperchip超級芯片的設計與性能、能效。
Grace CPU二合一
Grace CPU+Hopper GPU二合一
它通過NVLink-C2C芯片間互連總線,將兩顆Grace CPU整合在一塊基板上,彼此之間的雙向帶寬多達900GB/s。
Grace CPU基於Armv9-A 9.0架構、Neoverse V2 64位內核,以4個128-bit功能單元的方式配置兩組SIMD矢量指令集,一是SVE 2(縮放矢量擴展第二版),二是NEON(高級SIMD)。
它還支持LSE(大型系統擴展),可提供低成本的原子操作,改進CPU通信吞吐。
NVIDIA聲稱,這種核心的能效,是如今服務器常見x86核心的2倍。
Grace CPU單顆集成72個核心,互相通過3.2TB/s超高帶寬的NVIDIA縮放一致性Fabric總線互連,而二合一的超級芯片上就是144個核心。
每核心64KB一級指令緩存、64KB一級數據緩存、1MB二級緩存,一顆超級芯片的所有核心共享234MB三級緩存。
內存整合封裝LPDDR5X,最大容量960GB,最高帶寬1TB/s(每一顆500GB/s),還支持ECC。
對比傳統的八通道DDR5,這種設計不但帶寬高出53%,單位功耗也隻有1/8。
對比海量帶寬的HBM2e,單位成本隻有1/3,容量則可達8倍。
擴展支持八組PCIe 5.0 x16,總帶寬1TB/s,還有用於管理的低速PCIe通道。
性能方面,一顆超級芯片的FP64雙精度峰值浮點性能可達7.1TFlops(每秒7.1萬億次計算),熱設計功耗500W。
NVIDIA對比AMD Zen3架構的霄龍7763 64核心,雙路組成128核心,號稱性能可領先1.5-2.5倍,能效可領先2.0-3.5倍!
當然,AMD已經有Zen4架構、最多96核心的霄龍9004系列,NVIDIA Grace依然還沒有商用。