HotChips34大會史昂,Intel又公佈PonteVecchioGPU高性能計算卡的更多細節,包括性能數據。PonteVecchioGPU基於全新的XeHPC高性能計算架構,使用5種不同制造工藝(Intel7和臺積電N7/N5等)、多種封裝技術,整合多達47個不同計算模塊,晶體管數量超1000億個。
它一個模塊有128個Xe核心、128個光追單元、64MB一級緩存、408MB二級緩存、128GB HBM2e高帶寬內存,支持PCIe 5.0,可以四路甚至八路並聯。
Intel給出的最新數據聲稱,Ponte Vecchio FP32單精度、FP64雙精度性能可達52TFlops,TF3.2浮點性能可達419TFlops,BF16、PF16浮點性能可達839TFlops,INT8整數性能則可達1678Tops。
Data Parallel C++ (DPC++)測試項目中,Ponte Vecchio的性能相比於NVIDIA A100可以領先1.4-2.5倍。
另外,ExaSMR OpenMC計算性能可領先2倍,NekRS性能則領先0.3-1.7倍。
當然,NVIDIA新一代的H100都已經發佈……
Ponte Vecchio的使命是將聯合下一代可擴展至強Sapphire Rapids,用於美國的首批三臺百億億次超算之一Aorura,但不幸的是,Sapphire Rapids一再推遲,預計明年第二季度才能發佈,Ponte Vecchio也一直沒有量產上市。
相比之下,AMD三代霄龍處理器、Instinct MI250X加速卡組成的Frontier已經上線運行,並以1.6EFlops的性能,成為當今(公開的)超算之王。