圖形工程師:AMD Zen 4 CPU的AVX-512特性對模擬器大有裨益


RiotGames圖形工程師Joey(@Wunkolo)剛剛在Twitter上透露,AMDZen4CPU引入的AVX-512特性,可為Yuzu等模擬器帶來巨大的優勢。Wunkolo表示,自己多年來一直嘗試為模擬器測試AVX-512加速功能。而他的最新工作,正好可以極大地受益於AMD即將推出的銳龍7000系列AM5臺式處理器。

具體說來是,包括 Yuzu(任天堂 Switch)、Gitra(任天堂 3DS)、Vita3K(索尼 PS Vita)、以及 Xenia(微軟 Xbox 360)在內的模擬器,都可獲益於消費級 CPU 的 AVX-512 指令集。

此前英特爾曾嘗試在 12 代 Alder Lake CPU 中添加 AVX-512 加速特性,但後來又出於功耗等方面的考慮,而通過主板 CPU 微碼更新來鎖死(至強 / Xeon 芯片仍可用)。

數據方面,與標準的 AVX2 指令集相比,AVX-512 可為 RPCS3(索尼 PS3)等模擬器帶來高達 30% 的性能提升。

有趣的是,在 Intel 在消費級 CPU 市場放棄 AVX-512 的同時,AMD 這邊又為 Zen 4 銳龍 7000 系列 AM5 臺式處理器帶來 AVX-512 支持。

該公司稱,其 Zen 4 CPU 可通過 AVX-512(VNNI)將 FP32 推理性能提升 30%、且 INT8 推理性能可達 2.5 倍。

值得一提的是,Wunkolo 表示這些成績還是在沒有使用任何 256 位 ymm、或 512 位 zmm 寄存器的情況下完成的。

WCCFTech 指出,寄存器位寬能夠顯著擴展新指令級架構在特定項目上的表現。雖然在這段長篇大論中,Wunkolo 並未給出細致的個人工作說明,但確實也分享一些文檔鏈接。

對於喜歡玩模擬器、或者需要在特定場景下使用 AVX-512 指令集的朋友,大可期待銳龍 7000 和 13 代酷睿正式上市後的市場反響。


相關推薦

2022-10-11

啟用所有 AVX 模式(AVX2 / AVX512)—— 後者對模擬器應用大有裨益。至於 MSI 為銳龍 7000 系列 AM5 臺式處理器提供的核顯超頻選項,可知每款 CPU 都集成 RDNA 2 iGPU —— 擁有單個 WGP 工作集群 / 2 CU / 128 核。雖然默認頻率為 2.2 GHz,但

2022-09-05

數推理多線程性能可提升最多2.5倍。 來自Riot Games的圖形工程師Joey(Wunkolo)對於AMD Zen4 AVX-512指令集的支持非常感興趣,在一系列模擬器中已經加入相應的優化。具體包括:Switch模擬器Yuzu、3DS模擬器Citra、PS Vita模擬器Vita3K、Xbox

2022-10-06

在開發者的CPU排名表中顯示,AMDRyzen97950X已成為索尼PS3模擬器RPCS3的最佳選擇。AMD的最新處理器超越所有競爭對手,包括英特爾。此外,RPCS3幾天前剛剛獲得AVX-512支持,對開源仿真器來說,幸運的是,AMD最新的Zen4微架構支持AVX-512

2022-09-03

作為Mesa3D圖形項目的獨立貢獻者,YonggangLuo已開始著手為LLVMpipe啟用AVX-512支持。至於這麼做的原因,主要是AMD在Zen4銳龍7000系列臺式處理器上引入AVX-512指令集。通過驅動方面的優化,Luo希望為R9-7950X等CPU帶來最佳性能增益。有趣

2022-10-11

前不久我們報道知名的PS3模擬器軟件RPCS3宣佈添加對AMDZen4架構AVX-512指令集的支持,從而帶來遊戲性能的明顯提升。這還沒完,RPCS3公佈的排名顯示,銳龍97950X超越酷睿i9-12900K,成為其模擬器運行效果S級榜單中性能第一的型號。

2022-10-18

Zen 3 的架構差異並不大。不過相較於消費級市場,這項特性顯然更適用於新一代 EPYC(霄龍)Genoa 服務器平臺的使用場景。當然,對於要求不高的中小型企業,依然可借助支持 AVX-512 的 Ryzen 7000 系列處理器,來適當降低業務系統

2022-07-19

斷和跑分工具;AIDA64 Engineer 是適用於企業 IT 技術人員和工程師的專業診斷和跑分解決方案;AIDA64 Business 是適用於中小型企業的基礎網絡管理解決方案;AIDA64 Network Audit 是用於手機和管理企業網絡資產的專用網絡審查工具集。全

2022-10-11

動關閉,以進一步減少功耗。當然,如果是RPCS3(索尼PS3模擬器)用戶的話,那麼最好不要關閉。

2023-05-03

推理性能分別可提升多達30%、150%,對於AI、HPC、遊戲模擬器等特別有用,Intel用戶反而隻能眼饞。據最新曝料,AVX-512指令集將在未來的Intel消費級處理器上回歸,隻是需要一些時間。照此看來,Meteor Lake 14代酷睿幾乎不可能重

2023-11-03

多的核心數量、更好的多線程性能,對於視頻渲染等應用大有裨益,但需要操作系統、應用軟件專門適配和優化,增加復雜度,在遊戲裡有時候反而會起到副作用。回到產品上,Zen4c的加入,使得銳龍7000U系列有兩個不同版本。

2022-08-30

一個PCI-Express Gen 5根復合體,這個CIOD還配備一個基於RDNA2圖形架構的iGPU。新的6納米cIOD尺寸為124.7平方毫米,相比之下,Ryzen 5000系列的cIOD略大124.9平方毫米。"Raphael"多芯片模塊為6核和8核SKU配備一個CCD,為12核和16核SKU配備

2022-08-28

發佈在即,CPU基準測試工具y-cruncher確認AMDZen4傢族旗艦型號銳龍97950X,證實它和銳龍95950X一樣,還是16核心32線程的規格。同時可以證實的是,銳龍7000系列支持IntelAVX-512指令集,但讓人哭笑不得的是,引入混合架構的Intel12/13代酷

2024-04-03

系統上運行龐大的LLM模型變得更容易,因為采用AVX-512的AMDRyzenCPU性能提升10倍。Phoronix報道稱,Llamafile的最新更新現在支持AVX-512指令集,使支持AVX-512的CPU在使用該軟件時性能得到大幅提升。據悉,AMD 的 Zen 4"Ryzen"CPU 在使

2024-03-13

,在扣除以默認 170 W TDP 運行芯片所需的能耗成本後,在 AMD Ryzen 9 7950X 16 核處理器上進行 24 小時 Qubic 挖礦的成本約為 3 美元。像 7950X 這樣的"Zen 4"處理器,將頻率控制在較低水平也能保持大部分挖礦性能,並降低功耗限