基準測試表明英特爾Gaudi2加速器較英偉達A100更具特定優勢

2022-07-05 發表於業界精選

在2019年以20億美元收購以色列HabanaLabs後，英特爾推出Gaudi2數據中心加速卡，並將之與面世已有兩年的英偉達A100進行對比。事實上，Habana制造兩種專用加速器——除面向神經網絡訓練的Gaudi2，還有主打推理任務的Goya/Greco。

雖然早在 5 月就發佈，但 MLPerf 公共數據庫直到上周才接收到它的基準測試成績。

由其分享的圖表可知，Gaudi2 系統的分數，被拿來和英偉達 / 戴爾的 A100 系統進行橫向比較。

首先，ResNet-50 能夠測試硬件在 AI 圖像分類工作上的表現。可知 Habana 的 Gaudi2 系統隻需 18 分鐘就通過測試，而英偉達 A100 系統需要將近半個小時。

其次，Gaudi2 隻用 17 分鐘來訓練 BERT 模型，較 A100 系統快大約一分鐘。作為一個自然語言處理（NLP）模型，這項測試使用來自維基百科的文章來訓練。

雖然所有測試平臺都使用八卡加速器 / GPU，但 Habana 系統搭配雙路 40 核的 Intel Xeon 8380 CPU，而英偉達系統則采用雙路 64 核的 AMD EPYC 7742 CPU 。

規格方面，Gaudi2 具有 24 個張量處理（TPC）內核 + 並行運行的兩部分矩陣乘法（MME）引擎。其支持包括 FP32、TF32、BF16、FP16 和 FP8 在內的廣泛數據類型。

此外 Gaudi2 有一個專用於處理音視頻輸入的媒體引擎，集成 48MB 內部緩存 + 板載 96GB（6×16GB）HBM2e 高帶寬內存，總帶寬達到 2.45 TB/s 。

連接方面，該加速器使用 PCIe 4.0 x16 接口、輔以 24 個 100 Mbps RoCE2（RDMA over Converged Ethernet 2）端口。

需要指出的是，英偉達 A100 / H100 的功能要更加全面一些，Gaudi2 在某些特定任務上更具優勢。

不過就算英偉達早在三個月前就發佈 H100 新品，Gaudi2 還是有望成為 A100 的一個有力競爭對手。

相關推薦