Mesa3D正在為LLVMpipe啟用對AMD Zen 4 CPU的AVX-512支持


作為Mesa3D圖形項目的獨立貢獻者,YonggangLuo已開始著手為LLVMpipe啟用AVX-512支持。至於這麼做的原因,主要是AMD在Zen4銳龍7000系列臺式處理器上引入AVX-512指令集。通過驅動方面的優化,Luo希望為R9-7950X等CPU帶來最佳性能增益。

有趣的是,盡管 Intel 多年來一直在力推 AVX-512,但在 12 代酷睿臺式處理器身上,該公司還是通過後續的微碼更新而禁用這項高能耗特性。

出乎意料的是,AMD 卻選擇在 Zen 4 銳龍 7000 系列臺式處理器上提供 AVX-512 指令集。

至於 LLVMpipie,則是一種獨特的 Mesa OpenGL 軟解方案。當計算機系統找不到顯卡硬件 / GPU 驅動程序時,就可選擇基於 CPU 軟解的 LLVMpipe 方案。

不過相較於銳龍 7000 集成的 RNDA 2 核顯,軟解的優勢顯然不會如預期那般顯著 —— 即便 AMD 用的是 256-bit(而不是 512-bit)路徑。

據悉,LLVM 是“用於為任何編程語言創建前端、並為任何指令集架構創建後端的編譯器 / 工具鏈技術的一個集合”。

LLVMpipe 將允許 LLVM 使用一組特定的擴展,並提供較其它軟件軟件(比如 Softpipe / OpenGL)的可執行文件更高的性能。

截圖(來自:FreeDesktop)

目前尚不清楚 AVX-512 可在 AMD Zen 4 新架構上提供多高的性能,此外本次合並請求中包含一個被稱“GALLIUM_OVERRIDE_CPU_CAPS”的環境變量。

該變量能夠在 Softpipie 和 LLVMpipe 中覆蓋 CPU 功能,以禁用或啟用 AVX、SSE 和其它指令集功能。

最後,“LP_NATIVE_VECTOR_WIDTH”將允許更改向量位寬,以在 LLVMpipe 中使用 AVX、AVX2、或 AVX-512 。


相關推薦

2022-10-18

。Phoronix指出,AMD已發佈帶有更新後的Znver4目標的“基礎啟用補丁”。遺憾的是,目前已知的調整與Zen3相同,暫時沒有在變更日志中給出詳細的指令延遲差異等說明。(via Phoronix)本周早些時候,AMD 發佈 GNU 編譯器集合(GCC)的

2022-09-05

MD 這邊又為 Zen 4 銳龍 7000 系列 AM5 臺式處理器帶來 AVX-512 支持。該公司稱,其 Zen 4 CPU 可通過 AVX-512(VNNI)將 FP32 推理性能提升 30%、且 INT8 推理性能可達 2.5 倍。值得一提的是,Wunkolo 表示這些成績還是在沒有使用任何 256 位 ymm

2022-10-06

競爭對手,包括英特爾。此外,RPCS3幾天前剛剛獲得AVX-512支持,對開源仿真器來說,幸運的是,AMD最新的Zen4微架構支持AVX-512指令。在RPCS3中,AVX-512支持獲得30%的性能提升,這讓AMD Ryzen 9 7950X成為協助模擬PS3環境的最有影響力的

2022-07-19

為即將到來的Ryzen7000Zen4CPU和與之搭配的AM5系列主板提供支持。FinalWireLtd.今天發佈AIDA64Extreme6.75、AIDA64Engineer6.75、AIDA64Business6.75以及AIDA64NetworkAudit6.75。AIDA64 Extreme 是一款適用於傢庭用戶的主流的診斷和跑分工具;AIDA64 Engineer 是適

2022-08-28

是16核心32線程的規格。同時可以證實的是,銳龍7000系列支持IntelAVX-512指令集,但讓人哭笑不得的是,引入混合架構的Intel12/13代酷睿,因為小核心不支持AVX-512,不得不直接屏蔽,失去這個獨門武器。不過,y-cruncher作者承認,還

2024-04-03

enCPU性能提升10倍。Phoronix報道稱,Llamafile的最新更新現在支持AVX-512指令集,使支持AVX-512的CPU在使用該軟件時性能得到大幅提升。據悉,AMD 的 Zen 4"Ryzen"CPU 在使用新更新後,提示評估速度將提高十倍,最終使該工具的 LLM

2024-03-13

看起來加密貨幣挖礦熱潮又回來,礦工們正在啟動2022年的舊挖礦硬件來淘金,因為比特幣現在已經突破72000美元,並帶動其他幾種加密貨幣的價值,Qubic(QBIC)就是其中之一。盈利能力計算器顯示,在扣除以默認 170 W TDP 運行芯

2022-10-18

,相當於為新的Zenver4打個小補丁,加入對AVX-512指令集的支持。具體支持指令包括:AVX512F、AVX512DQ、AVX512IFMA、AVX512CD、AVX512BW、AVX512VL、AVX512BF16、AVX512VBMI、AVX512VBMI2、GFNI、AVX512VNNI、AVX512BITALG、AVX512VPOPCNTDQ。即將在年底發佈的同樣

2024-04-08

集。AVX-512指令集原本是Intel的獨門秘籍,AMDZen4架構開始支持,包括消費級的銳龍、數據中心級的霄龍,而尷尬的是,Intel因為使用大小核架構設計,下一代的ArrowLake、LunarLake很大概率不再支持AVX-512(也沒有超Zen4架構的AVX-512指令

2022-09-05

AMDZen4架構的銳龍7000系列將首次支持IntelAVX-512,雖然隻是一部分而不是完全體,但也是個重大突破,尤其是Intel12/13代酷睿因為混合架構反而不能開啟這一指令集,更先得非比尋常。AVX-512已經誕生很多年,但應用范圍一直不大,

2022-08-30

e i9-12900KS快200MHz,後者的單核提升頻率為5.5GHz。看起來AMD正在為Ryzen 9芯片的170W TDP盡可能地榨幹頻率潛能,該CPU配備80MB的緩存池,其中包括64MB的L3(每個CCD 32MB)和16MB的L2(每個核心1MB)。這款旗艦產品的價格為699美元,略高於

2022-08-17

這裡 Geekbench 軟件可能錯誤識別成 16MB(或者早期樣本隻啟用一半的 L3 Cache)。最終 32 核 EPYC 9000 Genoa CPU 單核 / 多線程得分為 1444 / 35329 分,而 96 核 EPYC 9000 Genoa CPU 則是 1464 / 19834 分。雙路 × 96 核心測試平臺如此怪異的成績,表

2022-11-11

核。正如我們在AMD Ryzen 7000 CPU上看到的那樣,該公司似乎正在為其EPYC Genoa CPU使用相同的鍍金CCD和IOD,這將通過IHS改善導熱性,IHS比上一代EPYC CPU上的IHS大得多。下圖中隻展示帶有12個CCD的頂級SKU,我們知道該系列中還有8個CCD和4

2024-03-20

先從移動端開始,然後是桌面端、服務器端,相關支持也正在緊鑼密鼓地進行中,尤其是Linux系統下。現在,AMD已經將Zen5微架構加入到GCC編譯器的支持,GCCGit倉庫的target設定值為“znver5”,可以趕上GCC4.1穩定版的發佈。目前已支