在2019年以20億美元收購以色列HabanaLabs後,英特爾推出Gaudi2數據中心加速卡,並將之與面世已有兩年的英偉達A100進行對比。事實上,Habana制造兩種專用加速器——除面向神經網絡訓練的Gaudi2,還有主打推理任務的Goya/Greco。
雖然早在 5 月就發佈,但 MLPerf 公共數據庫直到上周才接收到它的基準測試成績。
由其分享的圖表可知,Gaudi2 系統的分數,被拿來和英偉達 / 戴爾的 A100 系統進行橫向比較。
首先,ResNet-50 能夠測試硬件在 AI 圖像分類工作上的表現。可知 Habana 的 Gaudi2 系統隻需 18 分鐘就通過測試,而英偉達 A100 系統需要將近半個小時。
其次,Gaudi2 隻用 17 分鐘來訓練 BERT 模型,較 A100 系統快大約一分鐘。作為一個自然語言處理(NLP)模型,這項測試使用來自維基百科的文章來訓練。
雖然所有測試平臺都使用八卡加速器 / GPU,但 Habana 系統搭配雙路 40 核的 Intel Xeon 8380 CPU,而英偉達系統則采用雙路 64 核的 AMD EPYC 7742 CPU 。
規格方面,Gaudi2 具有 24 個張量處理(TPC)內核 + 並行運行的兩部分矩陣乘法(MME)引擎。其支持包括 FP32、TF32、BF16、FP16 和 FP8 在內的廣泛數據類型。
此外 Gaudi2 有一個專用於處理音視頻輸入的媒體引擎,集成 48MB 內部緩存 + 板載 96GB(6×16GB)HBM2e 高帶寬內存,總帶寬達到 2.45 TB/s 。
連接方面,該加速器使用 PCIe 4.0 x16 接口、輔以 24 個 100 Mbps RoCE2(RDMA over Converged Ethernet 2)端口。
需要指出的是,英偉達 A100 / H100 的功能要更加全面一些,Gaudi2 在某些特定任務上更具優勢。
不過就算英偉達早在三個月前就發佈 H100 新品,Gaudi2 還是有望成為 A100 的一個有力競爭對手。