User-Space Hinting將助力AMD霄龍處理器實現更好的任務性能發揮


趕在下周於愛爾蘭都柏林舉辦的LinuxPlumbersConference會議之前,AMD還計劃研討如何改進“拆分末級緩存”(LLC)架構的調度程序。作為AMDLinux服務器團隊的一名工程師,K.PrateekNayak剛剛發佈一系列補丁,並且專註於用戶空間提示(User-SpaceHinting)的任務放置計數。

Phoronix 指出:最新工作進展表明 AMD 打算改進 Linux 內核調度程序,並將之用於 LLC CPU 項目、以期改進該公司的 EPYC(霄龍)服務器處理器。

由 Linux 內核公告郵件列表(LKML)上的標記可知,新補丁仍處於“實驗性”和“意見征求”階段。

當前的 API 設計,隻能設置較為低級的提示,且並未面向公眾提供 —— 僅用於測試和演示 User-Space Hinting 在應用程序調度方案 / 最佳放置決策方面的功效。

若調度程序認為遵循提示將使系統處於次優狀態,則可自由地忽略用戶空間提示。

作為對比,當今調度程序使用的啟發式方法 —— 例如 WF-SYNC 標記、wake_wide()邏輯等 —— 仍存在無法準確推斷工作負載的性質的短板。

換言之,調度程序不明白是否最好將一組線程合並、還是拆分開來。由於無法推斷工作負載的性質,或導致一系列不準確的放置決策,進而對工作負載的性能造成不利影響。

對於具有拆分 LLC 的系統(例如 AMD EPYC 霄龍服務器平臺),其負面影響會被嚴重放大。

好消息是,該系列新補丁包括在本地組中存在非活動核心時、選擇父級附近的任務放置的功能。該過程負責決定繼續使用包含最少利用率的組來擴展工作負載,並檢查其它可能的提示。

其實早在去年,英特爾 Linux 內核團隊的工程師 Peter Zijlstra,也曾介紹過一個高級提示框架。

其旨在幫助內核調度程序的任務序列能夠應對日益復雜的 CPU 和工作負載,而當前狀態下的 User-Space Hinting 則是通過 prctl() 接口完成的。

最後,英特爾 Xeon Ice Lake 平臺上的初步測試結果表明,EPYC 服務器有望在 Hackbench、Schbench、Tbench 等各類工作負載上迎來性能的有效改進。

不過由於該系列補丁仍處於實驗階段,推測最終用戶需要等待數月,才會看到它已做好被添加至 Linux 內核中的準備。


相關推薦

2023-03-20

和雲計算,官方早已公佈將用於代號“Bergamo”的新一代霄龍處理器,可能臺積電4nm,最多128核心256線程,12通道DDR5內存,SP5封裝接口,今年上半年發佈。已知兩款型號,分別是霄龍9754 128核心、霄龍9734 112核心,三級緩存均為256M

2022-08-05

的26%成績。現在,該公司不僅實現第一個目標,而且目前霄龍(EPYC)在x86服務器 CPU 市場的份額已超過25%。Gartner、IDC和Mercury Research等市場分析師均認為 AMD 的服務器市場份額(主要包括其EPYC服務器CPU)約為25%以上。對於AMD的服

2022-07-18

根據曝料,AMD即將推出的Zen4EPYC霄龍處理器將命名為霄龍9000系列,最多96核心192線程,熱設計功耗最高360W。現在,我們第一次看到新霄龍的性能!來自旗艦型號霄龍9654P,96核心192線程,三級緩存384MB,功耗360W,而頻率之前理解

2023-11-07

Zen 4c核心發佈,AMD第一時間也推出兩款采用Zen 4c核心的銳龍處理器,它們分別為銳龍5 7545U和銳龍3 7440U。銳龍5 7545U采用6核心12線程設計,其中包含2個Zen 4大核以及4個Zen 4c小核,加速頻率4.9GHz,緩存22MB,TDP為15-30W。銳龍3 7440U采用

2022-08-17

@Benchleaks剛剛在Twitter上曬出兩款ES版AMD霄龍9000系列Genoa服務器處理器的Geekbench基準測試數據。盡管與正式版相比,兩款CPU的主頻相對較低,其單線程性能改進還是相當亮眼。其中96核心/192線程的EPYC9000Genoa處理器的編號為“100-00000

2023-03-07

神秘面紗。AMD Zen4處理器無論消費級銳龍,還是服務器級霄龍,CCD部分都是臺積電5nm工藝,最多8個核心。其中,銳龍有1-2個CCD,核心數6-16個;霄龍有2-12個CCD,核心數16-96個。IOD都是臺積電6nm工藝,但銳龍、霄龍搭檔的截然不同

2024-02-18

)允許一個物理內核在流水線中執行多條指令,這種並行處理本質上提高超線程芯片的多線程性能,因為芯片上的一個物理內核可以通過兩個超線程邏輯內核發揮兩個物理內核的作用。不過,這並不意味著一個超線程物理內核就

2022-07-04

與存儲解決方案提供商威聯通(QNAP),剛剛推出采用AMD霄龍(EPYC)平臺的TS-h1290FX塔式25GbENAS新品。作為旗下首款PCIe4.0兼U.2NVMe/SATA全閃存網絡附加存儲設備,其能夠在協作式高分辨率視頻等嚴苛的工作流程中表現出色。(來自:

2023-02-09

近日,Phoronix在最新得CPU測試中發現,AMD銳龍處理器在Linux上的性能表現,相較幾年前有著明顯的提升。從采用2020年的Pop!_OS系統,和2022年的Ubuntu 22.04 LTS穩定版的對比測試結果來看,在過去的三年中,Linux顯著提升AMD處理器的性

2022-09-28

昨晚,AMDZen4架構銳龍7000處理器正式開賣,國行方面,銳龍97950X5499元、銳龍97900X4299元、銳龍77700X2999元、銳龍57600X2249元。既然有新處理器,免不被發燒友們拿來折騰。硬件大神Der8auer出手,給手頭的Zen4銳龍來一波開蓋降溫。他先

2023-01-31

3DV-Cache堆疊緩存是AMD銳龍、霄龍處理器的一把利器,銳龍玩遊戲、霄龍特定負載加速都有奇效,銳龍75800X3D也因此成絕對的爆品。現在看起來,AMD顯卡也有望引入3DV-Cache緩存。權威半導體工程師Tom Wassick通過紅外成像,分析AMD RX 7

2024-05-10

大變化包括:- 針對現代 Ryzen 系統的 AMD P-State 首選內核處理。這是為利用 CPU 內核之間的 ACPI CPPC 數據,改善 AMD Ryzen 系統上可實現更高頻率的內核的任務分配,同時幫助在 Zen 4 和 Zen 4C 內核之間進行混合選擇。這種 AMD 首選內核

2022-08-19

槽,改為跟Intel處理器一樣的LGA觸點式,這一點也跟AMD的霄龍處理器統一起來。PGA與LGA封裝各有優劣,技術上的優勢爭論不完,但是對消費者來說“金針“(實際為銅針)有點危險,容易彎折不說,插拔散熱器的時候由於矽脂發

2022-07-15

路配置可提供最高 224 核 / 448 線程。相比之下,當前 AMD 霄龍(EPYC)雙路服務器平臺,最高隻有 128 核 / 256 線程的選項。性能方面,Xeon Platinum 8480+ 的 SiSoftware SANDRA 算術測試項目得分為 2987.54 GOP,而 Xeon Platinum 8450H 則是 2754.32 GOP