NVIDIA官方公開HopperH100GPU的規格信息,性能要比預期的更加強悍。今年早些時候,NVIDIA宣佈適用於AI數據中心的HopperH100GPU,最高可以達到60TFLOPs和30TFLOPsFP64。
不過伴隨著發售日期臨近,NVIDIA 再次更新其顯卡規格,表明在性能上再次有所提升。性能指標數字得到提升的一個原因是,當芯片投入生產時,GPU 制造商可以根據實際時鐘速度最終確定數字。 NVIDIA 很可能使用保守的時鐘頻率來提供初步的性能數據,隨著生產全面展開,該公司發現該芯片可以提供更好的時鐘頻率。
上個月在 GTC 上,NVIDIA 證實他們的 Hopper H100 GPU 正在全面生產,合作夥伴將在今年 10 月推出第一波產品。還確認 Hopper 的全球推廣將包括三個階段,第一個階段將是 NVIDIA DGX H100 系統的預購,以及直接從 NVIDIA 向客戶提供免費實驗室,這些系統包括戴爾的 Power Edge 服務器等系統,現在可在英偉達啟動板。
NVIDIA Hopper GH100 GPU 由一個巨大的 144 SM(流式多處理器)芯片佈局組成,共有 8 個 GPC。這些 GPC 共有 9 個 TPC,每個 TPC 進一步由 2 個 SM 單元組成。這使我們每個 GPC 有 18 個 SM,而在完整的 8 個 GPC 配置中,我們有 144 個。每個 SM 最多由 128 個 FP32 單元組成,這應該給我們總共 18,432 個 CUDA 內核。