AMD Zen5性能暴漲40%的秘密:獨享AVX-512指令集大升級


之前有說法稱,AMDZen5架構的單核理論性能相比Zen4可提升超過40%,相當不可思議,而根據MLID的最新說法,其中的秘密應該來自AVX-512指令集。AVX-512指令集原本是Intel的獨門秘籍,AMDZen4架構開始支持,包括消費級的銳龍、數據中心級的霄龍,而尷尬的是,Intel因為使用大小核架構設計,下一代的ArrowLake、LunarLake很大概率不再支持AVX-512(也沒有超

Zen4架構的AVX-512指令集是通過兩個256位FPU浮點單元來組合執行的,可以更靈活一些,功耗也更低,但性能達不到極致。

Zen5架構將會引入512位FPU單元,可以直接執行AVX-512,性能更強,也可高效執行VNNI等指令,更有利於提升AI表現。

為此,Zen5架構也會在其他方面升級配合,方便喂給FPU單元足夠的數據和指令。

比如增大一級緩存DTLB,一級數據緩存容量從32KB增大到48KB,比如載入存儲隊列加寬,比如FPU MADD延遲縮短一個時鐘周期,等等。

此外,Zen5架構的整數執行流水線也會從8條增加到10條。

不過,二級緩存容量保持不變,每核心還是1MB。


相關推薦

2024-06-12

Ridge),將在7月份上市,基於全新構建的Zen5架構,一方面性能大幅提升,另一方面功耗大幅下降。根據官方數據,Zen5架構的IPC同頻性能平均提升16%,極端情況可高達35%,而在核心數量、緩存容量、加速頻率等參數基本一致的

2023-01-20

TDP 360W(可調范圍320-400W)。三者開啟AVX-512指令集後,平均性能提升幅度分別為34.1%、44.2%、20.7%,Intel處理器上果然有更好的加持,尤其是四代至強上。但是,四代至強即便開啟AVX-512,也隻是勉強超過霄龍9000,而後者打開AVX-512

2023-05-03

引入完整的AVX-512,而且效果不俗,FP32浮點、INT8整數推理性能分別可提升多達30%、150%,對於AI、HPC、遊戲模擬器等特別有用,Intel用戶反而隻能眼饞。據最新曝料,AVX-512指令集將在未來的Intel消費級處理器上回歸,隻是需要一

2022-08-31

AMD昨天發佈的銳龍7000處理器中,不僅升級架構、性能大漲,同時還有一個新技術值得關註,那就是支持AVX512,這是Intel多年前開發的高性能加速指令集,軟件優化之後可以大幅提升性能。在發佈會上,AMD介紹銳龍7000在支持AVX512

2022-10-18

56-bit指令,官方稱這可以節省芯片面積,避免發熱過大、性能降低。諸多新指令中,VNNI、BF16是面向AI加速的,官方號稱FP32浮點推理多線程性能可提升1.31倍,VNNI INT8整數推理多線程性能可提升2.47倍!

2022-09-05

VX-512指令集主要用於AI、HPC應用加速,FP32浮點推理多線程性能可提升最多1.3倍,INT8整數推理多線程性能可提升最多2.5倍。 來自Riot Games的圖形工程師Joey(Wunkolo)對於AMD Zen4 AVX-512指令集的支持非常感興趣,在一系列模擬器中已

2022-09-05

比,AVX-512 可為 RPCS3(索尼 PS3)等模擬器帶來高達 30% 的性能提升。有趣的是,在 Intel 在消費級 CPU 市場放棄 AVX-512 的同時,AMD 這邊又為 Zen 4 銳龍 7000 系列 AM5 臺式處理器帶來 AVX-512 支持。該公司稱,其 Zen 4 CPU 可通過 AVX-512(VN

2022-09-03

集。通過驅動方面的優化,Luo希望為R9-7950X等CPU帶來最佳性能增益。有趣的是,盡管 Intel 多年來一直在力推 AVX-512,但在 12 代酷睿臺式處理器身上,該公司還是通過後續的微碼更新而禁用這項高能耗特性。出乎意料的是,AMD 卻

2022-08-27

AVX512本來是Intel針對高性能計算推出一套指令集,至強處理器上很常見,在消費級的酷睿上就不確定,12代酷睿因為小核不支持的緣故還把大核支持的AVX512指令集封殺,但是隨著銳龍7000的到來,這個可能會變成AMD跑分的一個優勢

2022-10-06

Zen4微架構支持AVX-512指令。在RPCS3中,AVX-512支持獲得30%的性能提升,這讓AMD Ryzen 9 7950X成為協助模擬PS3環境的最有影響力的處理器。結果顯示,AMD Zen 4的單線程性能是至關重要的,因為該CPU超過英特爾第11代酷睿"Rocket Lake"C

2024-03-20

“znver5”,可以趕上GCC4.1穩定版的發佈。目前已支持的新指令集有:AVXVNNI、MOVDIRI、MOVDIR64B、AVX512VP2INTERSECT、PREFETCHI。後續,AMD還會不斷更新更多優化與增強,讓開發者可以提前熟悉並利用Zen5的新技術特性。Zen5首發產品預計是

2024-04-03

運行龐大的LLM模型變得更容易,因為采用AVX-512的AMDRyzenCPU性能提升10倍。Phoronix報道稱,Llamafile的最新更新現在支持AVX-512指令集,使支持AVX-512的CPU在使用該軟件時性能得到大幅提升。據悉,AMD 的 Zen 4"Ryzen"CPU 在使用新更

2022-10-18

知的調整與Zen3相同,暫時沒有在變更日志中給出詳細的指令延遲差異等說明。(via Phoronix)本周早些時候,AMD 發佈 GNU 編譯器集合(GCC)的基礎支持代碼,擴展對 Zen 4 微架構的支持。相信隨著時間的推移,該公司還會帶來與 Znv

2022-08-28

,畢竟面對大小核架構的12/13代酷睿,AMD這兩年在多線程性能上是非常吃虧的。AMD技術營銷總監Robert Hallock曾經澄清過,銳龍7000系列沒有24核心,但是真真假假誰能說得清呢。隻是,Zen3架構的線程撕裂者PRO 5000WX系列已經零售開賣