在HotChips大會期間,英偉達詳細介紹該公司的GraceCPU設計。作為一種經典意義上的中央處理器,其旨在取代英特爾至強(Xeon)/AMD霄龍(EPYC)競品,以在預先構建的高性能計算(HPC)服務器中扮演串行處理的角色——因為每臺服務器的六張GPU加速卡需要通過CPU進行互連。
(via WCCFTech)
據悉,該公司不僅研究 CPU 層面的 I/O 與機器架構的瓶頸,還意識到其計算服務器需要專門為這樣的應用場景而定制中央處理器。
得益於針對 NVIDIA API 的高度架構優化,Grace CPU 就此應運而生。
作為該公司首款服務器 CPU 產品,其效用可與 Intel / AMD 競品一較高下。
作為一款單芯片,其采用臺積電 N4(4nm EUV)工藝制造,且英偉達將帶有一兩顆 Grace CPU + 一顆 H100 的板子稱作 Superchip 或 Grace Hopper 超級芯片。
可知每個Grace CPU 包含一個 900 GB/s 的交換結構,以及一個帶寬達到 PCIe 5.0 x16 七倍的 Coherent Interface 接口。
後者也是將相伴的 H100 或節點上相鄰的超級芯片、與一致的內存訪問連接起來的關鍵。
Grace CPU 的串行處理能力,由 72 核心的 ARM v9 64-bit CPU 提供,而一枚超級芯片則包含 144 個核心。
主內存采用 LPDDR5x 接口(支持 ECC),每個‘插槽’的帶寬高達 1 TB/s —— 媲美超過 24 個通道的 DDR5 方案。
此外具有 68 條 PCIe 5.0 扮演關鍵的串行 IO 接口角色,其主要被用於連接 NVMe 存儲設備,且芯片的標稱峰值 TDP 功耗達到 500W 。
隨著 Grace CPU 的亮相,英偉達展示該公司為企業和 HPC 應用場景設計大型多核處理器方面的強大工程實力。TechPowerUp 指出:
鑒於 ARM 已大幅縮小與 x86-64 平臺的性能、效率和 IPC 表現差距,我們也不難理解綠廠為何沒能拿到藍廠的 x86 許可,原本它有望交付出與英特爾相媲美的企業級處理器。
即便如此,英偉達的 DGX 計算節點、以及後續的更多預構建工作站 / 服務器(涵蓋眾多應用場景),勢必將逐漸擺脫傳統 x86 CPU、並用 Grace 及其繼任者取而代之。