在上月的VISION會議上,英特爾宣佈瞭Gaudi2硬件。作為該公司旗下HabanaLabs用於訓練和推力的第二代加速器,它也同步迎來瞭開源Linux內核驅動/用戶空間軟件堆棧更新。英特爾宣稱Gaudi2的AI訓練性能是英偉達A100競品方案的兩倍,且芯片制造工藝也從初代16nm升級到瞭7nm。
(via Phoronix)
此外 Gaudi2 迎來瞭 3 倍的 TPC 改進,32GB HBM2 高帶寬內存增加到瞭 96GB HBM2e、SRAM 緩存也翻倍到瞭 48MB,輔以 24×100 GbE 連接,但熱設計功耗(TDP)也從 350W 提升到瞭 600W 。
在發佈一個多月後,Habana Labs Gaudi2 的開源驅動程序工作也在有條不紊地推進中。而當前的 Gaudi2 支持,正好建立在現有的 Gaudi 和 Goya 加速器內核驅動程序(habanalabs)的基礎上。
Habana.ai 白皮書揭示瞭與 Gaudi2 架構相關的更多信息
從驅動角度來看,Gaudi2 與初代非常接近,整體架構也是一個樣。啟用 Gaudi2 大約需要 15.8 萬行新內核代碼,但其中大部分屬於“頭文件”(AMDGPU 內核驅動程序也有大量頭文件)。
截至目前,新的頭文件主要代表瞭該主線驅動程序啟用 Gaudi2 支持所需的大部分代碼變動。除瞭內核驅動工作,英特爾今日還發佈瞭 TPC_LLVM 1.1(針對 Habana Labs 加速器的新版開源編譯器)。
TPC_LLVM 1.1 添加瞭對 Gaudi2 及新的 Greco ASIC 編譯器的支持
與此同時,英特爾也在努力更新 SynapseAI Core for Gaudi2 開源組件,新補丁系列用於新的 Gaudi2 內核驅動程序代碼。
鑒於新版是從相同的 Gaudi 架構演變而來,預計後續的代碼審核工作也會相當順利,那樣我們就有望在 v5.20 內核周期內盡快添加對 Intel Gaudi2 的支持。
最後,英特爾還在 VISION 2022 會議上宣佈瞭從 Goya 升級而來、針對深度學習應用而作出效率優化的 Greco 加速卡。