1.8萬核心GPU、144核心CPU NVIDIA大殺器將揭開面紗


HotChips年度芯片行業盛會將在本月底舉行,Intel、AMD、NVIDIA和眾多業內芯片巨頭都將拿出各傢的拳頭產品,秀秀肌肉。NVIDIA這次會有多場分享,重點覆蓋HopperGPU計算加速器、GraceCPU服務器處理器、NVLink高速總線,屆時會有多位高級工程師分享內部架構設計、性能數據。

Hopper GPU采用定制版臺積電4nm工藝、全新架構,集成多達800億個晶體管、18432個CUDA核心、576個Tensor核心,支持6144-bit位寬的80GB HBM3/HBM2e高帶寬內存,並支持PCIe 5.0、第四代NVLIink,性能號稱四倍於上代A100,功耗最高700W。

Grace CPU采用雙芯合體設計,攻擊144個Arm架構核心,集成396MB緩存,支持LPDDR5X ECC內存,帶寬達1TB/s,同樣支持PCIe 5.0,功耗500W。

NVIDIA還打造一顆超級芯片,Hopper GPU、Grace CPU二合一,通過NVLink-C2C高速總線互連,帶寬達900GB/s。


相關推薦

2022-09-09

NVIDIA GeForce RTX 4090將使用144個SMs中的128個SMs,共16384個CUDA核心。該GPU將配備96MB的二級緩存和總共384個ROPs,工作頻率尚未確認,但考慮到正在使用臺積電4N工藝,預計工作頻率將在2.0-3.0 GHz之間。至於內存規格,GeForce RTX 4090預計將

2022-09-12

NVIDIA GeForce RTX 4090將使用144個SM中的128個SM,總共16384個CUDA核心。這款GPU將配備96MB的二級緩存和總共384個ROPs,時鐘速度尚未確認,但考慮到正在使用臺積電4N工藝,我們預計時鐘將在2.0-3.0GHz范圍內。至於內存規格,GeForce RTX 4090預

2022-09-12

VIDIA GeForce RTX 4090將使用144個SMs中的128個SM,共計16384個CUDA核心。這款GPU將配備96MB的二級緩存和總共384個ROP。時鐘速度尚未確認,但考慮到正在使用臺積電4N工藝,我們預計時鐘將在2.0-3.0GHz范圍內。至於內存規格,GeForce RTX 4090預

2023-03-26

DLSS3的。與之前的FSR超分辨率技術相比,FSR3也會引入新的核心技Fluid Motion Frames(平滑移動幀),可以跟NVIDIA的DLSS3技術硬剛一波。AMD之前展示的UE5引擎的效果,開啟FSR 3之後性能從60fps提升到112fps,潛力很大,2倍性能很輕松。FSR3

2023-05-17

多個消息來源聲稱今年三星的可折疊產品將提前推出,具體可能在7月下旬。雖然沒有人提供確切的日期,但韓國出版物ChosunMedia聲稱,三星將於7月26日發佈GalaxyZFold5和GalaxyZFlip5,並在8月11日開始銷售。該出版物進一步聲稱,三星

2024-03-11

我們知道,微軟自己並不做SSD產品,但是近日突然冒出來一個“Z1000”,赫然打著Microsoft的標識,可能是微軟給自傢數據中心定制的。微軟Z1000SSD的總容量為960GB,配備四顆東芝BiCS496層堆疊eTLC閃存顆粒,單顆容量256GB,同時有美

2023-03-27

多達瘋狂的1460億個!它同時集成CDNA3架構的GPU單元(具體核心數量未公開)、Zen4架構的24個CPU核心、大容量的Infinity Cache無限緩存,還有8192-bit位寬、128GB容量的HBM3高帶寬內存。

2022-09-22

諾斯羅普-格魯曼和美國空軍日前宣佈,B-21Raider戰略重型核打擊轟炸機將於12月的第一周在諾斯羅普公司位於加利福尼亞州帕姆代爾的工廠舉行的活動(隻有受到邀請的人員才能參加)中首次公開亮相。自2015年美國防部將設計和

2022-07-27

7月27日晚間,華為HarmonyOS3及華為全場景新品發佈會在線上舉行,華為常務董事、終端BGCEO、智能汽車解決方案BUCEO餘承東在會上披露,華為鴻蒙設備數已突破3億,鴻蒙智聯生態設備超過1.7億臺。而隨著鴻蒙系統的升級,華為在網

2023-06-15

的區別在於,MI300A是CPU GPU架構的,AMD首次封裝24核Zen4 CPU核心,其他的是CDNA3架構GPU,有128GB HBM3內存。MI300X則是常規的純GPU計算方案,把24核CPU替換為更多的GPU單元,因此提升到192GB HBM3內存,內存帶寬高達5.2TB/s,Infinity Fabric總線

2023-01-21

供低成本的原子操作,改進CPU通信吞吐。NVIDIA聲稱,這種核心的能效,是如今服務器常見x86核心的2倍。Grace CPU單顆集成72個核心,互相通過3.2TB/s超高帶寬的NVIDIA縮放一致性Fabric總線互連,而二合一的超級芯片上就是144個核心。

2024-03-20

代H100 800億個增加足足30%,B200整體就是2080億個晶體管。核心面積未公佈,考慮到工藝極限應該不會比814平方毫米的H100大太多。CUDA核心數量也沒說,但肯定會大大超過H100 16896個,不知道能不能突破2萬個?每顆B100連接四顆24GB HB

2023-02-13

“中正評測”提前泄露RTX4060的跑分成績。RTX4060擁有3072個核心、128-bit顯存,相比於RTX30603840個核心、192-bit顯存明顯“退步”一個檔次,但頻率大幅提升,公版標準從1.7GHz提高到近2.4GHz,實際還能更高。測試用筆記本是雷神ZERO,

2023-02-24

內核由12個增加至20個,分成5個集群,每個集群包含4個CPU核心,CPU的最大頻率為2.35GHz,閑時頻率1.37GHz,GPU不變,依舊是基於AMD 打造的RDNA2,28組運算單元,2.79GHz主頻,3個NPU,工作頻率為2.2GHz,TRIP 內核數量從 2 個增加到 3 個,