Hot Chips 34:擺脫x86束縛 英偉達詳解Grace服務器CPU設計


在HotChips大會期間,英偉達詳細介紹該公司的GraceCPU設計。作為一種經典意義上的中央處理器,其旨在取代英特爾至強(Xeon)/AMD霄龍(EPYC)競品,以在預先構建的高性能計算(HPC)服務器中扮演串行處理的角色——因為每臺服務器的六張GPU加速卡需要通過CPU進行互連。

(via WCCFTech)

據悉,該公司不僅研究 CPU 層面的 I/O 與機器架構的瓶頸,還意識到其計算服務器需要專門為這樣的應用場景而定制中央處理器。

得益於針對 NVIDIA API 的高度架構優化,Grace CPU 就此應運而生。

作為該公司首款服務器 CPU 產品,其效用可與 Intel / AMD 競品一較高下。

作為一款單芯片,其采用臺積電 N4(4nm EUV)工藝制造,且英偉達將帶有一兩顆 Grace CPU + 一顆 H100 的板子稱作 Superchip 或 Grace Hopper 超級芯片。

可知每個Grace CPU 包含一個 900 GB/s 的交換結構,以及一個帶寬達到 PCIe 5.0 x16 七倍的 Coherent Interface 接口。

後者也是將相伴的 H100 或節點上相鄰的超級芯片、與一致的內存訪問連接起來的關鍵。

Grace CPU 的串行處理能力,由 72 核心的 ARM v9 64-bit CPU 提供,而一枚超級芯片則包含 144 個核心。

主內存采用 LPDDR5x 接口(支持 ECC),每個‘插槽’的帶寬高達 1 TB/s —— 媲美超過 24 個通道的 DDR5 方案。

此外具有 68 條 PCIe 5.0 扮演關鍵的串行 IO 接口角色,其主要被用於連接 NVMe 存儲設備,且芯片的標稱峰值 TDP 功耗達到 500W 。

隨著 Grace CPU 的亮相,英偉達展示該公司為企業和 HPC 應用場景設計大型多核處理器方面的強大工程實力。TechPowerUp 指出:

鑒於 ARM 已大幅縮小與 x86-64 平臺的性能、效率和 IPC 表現差距,我們也不難理解綠廠為何沒能拿到藍廠的 x86 許可,原本它有望交付出與英特爾相媲美的企業級處理器。

即便如此,英偉達的 DGX 計算節點、以及後續的更多預構建工作站 / 服務器(涵蓋眾多應用場景),勢必將逐漸擺脫傳統 x86 CPU、並用 Grace 及其繼任者取而代之。


相關推薦

2023-12-01

Hopper架構或兩個CPU,而他們可能隻需要一個芯片。不過,英偉達確實有計劃單獨提供其高端 Grace CPU。英偉達目前的 GPU 路線圖仍然顯示,該公司希望通過即將推出的 GH200、GB200 和 GX200 等架構,將其超級芯片設計擴展到 CPU+GPU 套

2022-09-22

在今日的簡報中,英偉達分享GeForceRTX4090公版(FoundersEdition)顯卡的一些設計細節,包括PCB、散熱器、以及峰值功耗控制。盡管從產品外形上來看,RTX4090和RTX3090Ti很相似,但官方還是指出多處變更。比如金屬外框的青銅色更明顯

2023-12-02

器CPU可定制化特性的還有最重要的AI芯片提供商之一——英偉達。在英偉達強大的GH200超級芯片中,包含72顆Arm Neoverse核心,加上英偉達的GPU,GH200的AI性能較基於x86架構的系統可提升10倍。為滿足更多客戶在基礎設施建設中的定制

2023-01-16

以往每隔18個月靠工藝迭代帶來的常規演變,以英特爾、英偉達和AMD為首的芯片巨頭之間的競爭變得異常激烈。從英特爾、英偉達、AMD三傢的產品佈局來看,三傢幾乎都集齊CPU、GPU甚至是DPU產品線。如今,他們正在醞釀更大的規

2022-07-20

的DPU和AI芯片等都稱為大芯片。大傢耳熟能詳的英特爾、英偉達、AMD、高通、聯發科和Marvell等全球領先芯片公司都是典型的大芯片龍頭。2021年一季度的全球TOP 10芯片設計公司(source:集邦咨詢)在芯片產業過去幾十年的發展中

2023-08-10

列重磅更新來!在計算機圖形學頂會SIGGRAPH上,老黃宣佈英偉達最新的超級芯片NVIDIADGXGH200GraceHopper。這塊芯片搭載全球最快的內存,不僅帶寬每秒5TB,內存容量更是暴增接近50%來到141GB,“任何大語言模型都能運行”。同時,英

2023-03-22

全球AI計算技術盛會、一年一度的英偉達GTC大會如期而至!英偉達CEO黃仁勛(昵稱“老黃”)一如既往穿著標志性的皮衣進行78分鐘演講,滿面笑容地分享英偉達又悶聲幹哪些大事。總體來看,此次演講可總結成一大‘亮點’和

2024-04-01

而是 Arm 及其授權廠商,如蘋果、高通、三星、聯發科和英偉達。在 iPhone 問世後的幾十年裡,Arm 從智能手機發展到個人電腦(如驍龍 X、蘋果 M3)和服務器(如安培 Altra 和英偉達 Grace)。英特爾似乎突然意識到,英特爾產品應

2023-07-16

局?龐大的算力需求也意味著需要高昂的訓練成本。根據英偉達的數據,GPT-3需要使用1024顆 A100芯片訓練長達一個月的時間,總成本約為460萬美元。而 GPT-4的訓練成本大約在1億美元左右,GPT-5的成本會更高。毫無疑問,AI 大模型的

2024-03-21

當地時間3月18日,英偉達在2024GTC大會上發佈多款芯片、軟件產品。創始人黃仁勛表示:“通用計算已經失去動力,現在我們需要更大的AI模型,更大的GPU,需要將更多GPU堆疊在一起。這不是為降低成本,而是為擴大規模。”作為

2024-05-08

天風國際分析師郭明錤預測,英偉達下一代AI芯片R系列/R100將在2025年4季度量產,系統/機櫃方案預計將在2026年上半年量產。據悉,R100將采臺積電的N3制程與CoWoS-L封裝(與B100相同)。R100采用約4xreticle設計(vs.B100的3.3xreticle設計)。R

2022-07-02

10%的出貨量份額,比2020年的3%大幅上升。其中,亞馬遜和英偉達是這類服務器的主要采購者。報道指出,亞馬遜是最熱衷於部署基於Arm服務器的數據中心運營商。除瞭EC2公共雲服務外,亞馬遜還針對邊緣服務器應用推出瞭基於Arm

2022-08-22

在自研CPU上,NVIDIA去年就公佈GraceCPU服務器處理器,這是一款高達144核的ARM處理器,日前在hotchips會議上NVIDIA又公佈Grace的架構細節及跑分,SPECrate2017_int_base最高可達740分,不僅超過AMD及Intel的x86旗艦,也超過前不久拿下第一的阿

2023-03-24

PU,一塊20.3 x 12.7厘米就能放下,兩個一組可以放入1U風冷服務器機架。