2022年8月,美政府對NVIDIAA100、H100兩款計算加速卡實施禁令,不得銷售給中國企業,黃仁勛隨後表態會推出替代版本。很快,NVIDIA就拿出專供中國市場的A800,在已有A100的基礎上將NVLink高速互連總線的帶寬從600GB/s降低到400GB/s,其他完全不變。如此一來,A800的大規模擴展互連將受到限制,但是單卡性能沒有損失。
昨晚的GTC 2023春季圖形大會上,NVIDIA又確認為中國市場開發第二個特供版H800,基於已有的H100調整而來,符合美政府的規定。
NVIDIA沒有透露H800的具體變化,外媒稱和A800類似,將芯片間互連帶寬縮減一半,如果用於AI訓練會消耗更長的時間。阿裡巴巴、百度、騰訊BAT三巨頭都已經用上H800加速卡。
H100加速卡采用全新的Hopper架構,GH100 GPU核心,臺積電4nm制造工藝、CoWoS 2.5D封裝技術,集成800億個晶體管,核心面積814平方毫米。
它擁有18432個CUDA核心、576個Tensor核心、60MB二級緩存,可搭配6144-bit位寬的六顆HBM3/HBM2e,總容量80GB,支持PCIe 5.0、第四代NVLink總線。
兩種樣式,其中SXM版本15872個CUDA核心、528個Tensor核心,顯存帶寬3.35TB/s,NVLink帶寬900GB/s,PCIe 5.0帶寬128GB/s,熱設計功耗最高700W。
PCIe 5.0版本14952個CUDA核心、456個Tensor核心,顯存帶寬2TB/s,NVLink帶寬600GB/s,PCIe 5.0帶寬128GB/s,熱設計功耗300-350W。
目前尚不清楚中國特供的H800是哪種樣式,猜測很可能是PCIe,那麼NVLink互連帶寬就隻有300GB/s,PCIe 5.0則應該不會縮水。
A800規格表
H100規格表:精簡一下帶寬就是H800
H100加速卡