Intel GPU號稱領先NVIDIA 2.5倍?細看尷尬


HotChips34大會史昂,Intel又公佈PonteVecchioGPU高性能計算卡的更多細節,包括性能數據。PonteVecchioGPU基於全新的XeHPC高性能計算架構,使用5種不同制造工藝(Intel7和臺積電N7/N5等)、多種封裝技術,整合多達47個不同計算模塊,晶體管數量超1000億個。

它一個模塊有128個Xe核心、128個光追單元、64MB一級緩存、408MB二級緩存、128GB HBM2e高帶寬內存,支持PCIe 5.0,可以四路甚至八路並聯。

Intel給出的最新數據聲稱,Ponte Vecchio FP32單精度、FP64雙精度性能可達52TFlops,TF3.2浮點性能可達419TFlops,BF16、PF16浮點性能可達839TFlops,INT8整數性能則可達1678Tops。

Data Parallel C++ (DPC++)測試項目中,Ponte Vecchio的性能相比於NVIDIA A100可以領先1.4-2.5倍。

另外,ExaSMR OpenMC計算性能可領先2倍,NekRS性能則領先0.3-1.7倍。

當然,NVIDIA新一代的H100都已經發佈……

Ponte Vecchio的使命是將聯合下一代可擴展至強Sapphire Rapids,用於美國的首批三臺百億億次超算之一Aorura,但不幸的是,Sapphire Rapids一再推遲,預計明年第二季度才能發佈,Ponte Vecchio也一直沒有量產上市。

相比之下,AMD三代霄龍處理器、Instinct MI250X加速卡組成的Frontier已經上線運行,並以1.6EFlops的性能,成為當今(公開的)超算之王。


相關推薦

2023-01-21

NVIDIA對比AMD Zen3架構的霄龍7763 64核心,雙路組成128核心,號稱性能可領先1.5-2.5倍,能效可領先2.0-3.5倍!當然,AMD已經有Zen4架構、最多96核心的霄龍9004系列,NVIDIA Grace依然還沒有商用。

2023-01-04

GPU也發佈來,首次將RTX4090級別的顯卡帶入到移動平臺,號稱筆記本性能及能效史上最大一次飛躍。GeForce RTX 40系列GPU采用NVIDIA的 Ada Lovelace GPU架構,在性能和能效方面實現有史以來最偉大的一代飛躍,所有主要制造商的170多臺筆

2022-07-01

更靈活】2021年3月底,Arm正式發佈瞭全新的Armv9指令集,號稱10年最重要的創新、面向未來10年移動計算的基石。Armv9重點增強矢量計算(SEV2指令集)、機器學習、數字信號處理,強化安全性,並繼續提升性能,號稱IPC性能未來兩代

2022-07-06

在最新的6月29日公佈的MLPerf訓練2.0版本的結果中,NVIDIA的領先地位可以從榜單中的兩個地方看出:首先是使用NVIDIA GPU提交結果的數量。在這次MLPerf的最新訓練榜單中,絕大多數(90%以上)機構提交的訓練結果都是基於NVIDIA的GPU

2024-05-02

調必須是CPU、GPU、NPU三位一體,尤其是大力推行新的NPU,NVIDIA作為顯卡廠商就不幹,認為隻有配備強大的RTXGPU顯卡才是真正的AIPC。NVIDIA RTX GPU誕生於2018年,這些年來陸續進入各個行業領域,提供廣泛的應用加速,包括但不限於

2022-09-09

在單個服務器和離線場景中均展現出吞吐量和速度方面的領先優勢。以NVIDIA  A100相比,H100在MLPerf模型規模最大且對性能要求最高的模型之一——用於自然語言處理的BERT模型中表現出4.5倍的性能提升,在其他五個模型中也都

2022-09-28

雲遊戲流。然後在 HEVC 和 Resnet50 跑分方面,Intel Flex GPU 領先 NVIDIA A10 多達 35% 。盡管大多數其它基準測試並未直接與競品對比,但諸多 AI 推理工作負載還是有望為潛在客戶提供基準參考。最後,英特爾宣佈超過 15 款的系統設計

2022-08-25

在先進工藝競爭上,三星跟臺積電一直是領先的兩傢,而且這兩傢公司可謂一時瑜亮,三星最近10年被臺積電各種壓制,直到6月底的3nm工藝上三星終於搬回一局,搶先量產3nm,而且是GAA晶體管技術。相比之下,臺積電的3nm工藝還

2023-12-07

生成式AI對於超強算力、廣泛應用的需求:GPU方面有世界領先的EPYC處理器,GPU方面有不斷壯大的Instinct加速器,網絡方面則有Alveo、Pensando等技術,軟件方面還有ROCm開發平臺,從而形成一個有機的、完整的解決方案。AMD早期的計

2024-02-04

NVIDIA近日正式發佈新一代入門級顯卡RTX30506GB,也就是RTX30508GB全面精簡的產物(感覺更應該叫做RTX3040),目前已有多傢新品悄然上架,價格最低為1399元。比如七彩虹靈動版、盈通極速版(單風扇)/大地之神版、索泰萬圖師版都是這個

2022-08-23

反應堆設計仿真設計中,英特爾 Ponte Vecchio GPU 也以 1.5 倍領先於英偉達競品方案。不過需要指出的是,英偉達早已向市場投放性能更加強悍的 Hopper H100,所以英特爾這裡拿 Ampere A100 進行比較還是相當投機取巧的。言歸正傳,英

2022-08-09

新企業壁仞科技(Birentech)正式發佈BR100系列通用計算GPU,號稱算力國內第一,多向指標媲美設置超越國際旗艦產品。根據介紹,壁仞科技BR100芯片采用臺積電7nm工藝制造、2.5DCoWoS封裝技術、Chiplet小芯片技術,集成多達770億晶體管

2022-08-02

換代的速度仍然不容樂觀。這也是Intel在傳統市場上不再領先的核心原因。除半導體工藝之外,Intel在封裝工藝和相應的下一代核心設計上也沒能保持傳統的優勢。就在AMD成功使用下一代chiplet設計並結合先進封裝技術大大提升良

2022-08-28

於光線追蹤非常消耗資源,開啟後遊戲幀率會大幅降低,NVIDIA最先提出DLSS超分辨率技術,保證兼具畫質、性能,AMD也打造FSR,Intel則提出XeSS。IntelXeSS原計劃今年夏初落地,但時至今日依然是空中樓閣。在沉默一個多月後,Intel終