64位ARM Linux內核團隊反對CPU特定優化 因為這相當難以維護


在Linuxx86_64內核中,針對特定微體系結構的優化非常普遍,英特爾和AMDCPU系列都采用各種性能技巧,而ARM64Linux內核維護者卻反對引入新的特定微體系結構優化,因為這會影響到新的ARM處理器。

image.webp

Ampere Computing 發送一組 4 個補丁,為其新的 AmpereOne 服務器處理器提供優化。Ampere Computing 發現,當使用 4K 頁面大小時,這些新的高內核數 ARM 服務器處理器可以從積極的預取中獲益。據報告,在連續讀取性能測試中,使用 HugeTLB 或 Tmpfs 的收益"高達 1.3 ~ 1.4 倍"。

測試結果顯示,在 hugetlb 或 tmpfs 中,我們可以將連續讀取性能大幅提升至 1.3x ~ 1.4x。雖然這些提升對於增強 AmpereOne Linux 性能來說令人興奮,但目前看來,這項工作不會被上傳到主線 Linux 內核中。

image.webp

著名的 ARM Linux 內核開發人員 Will Deacon 就 AmpereOne CPU 的性能增強補丁發表自己的看法:

"我們傾向於回避 arm64 內核中針對微體系結構的優化,因為這些優化非常難以維護,難以正確測試,通常會導致臃腫,並為更新我們的庫例程增加額外的障礙。

誠然,我們在 copy_page()(偽裝成 ARM64_HAS_NO_HW_PREFETCH)中為 Thunder-X1 提供一些幫助,但坦率地說,那臺機器需要一切可以得到的幫助。

因此,我真的不希望合並;現代 CPU 在復制數據方面應該做得更好。這是 copy_to_user(),不是火箭科學。"

ARM 的馬克-拉特蘭(Mark Rutland)也同意Deacon的說法,並贊同取消 Thunder-X1 的針對性優化。內核開發人員 Marc Zyngier 也表示同意,並已在開發一個補丁,以刪除 Thunder-X1 的特定代碼。

為保持代碼的可維護性,避免 ARM64 Linux 內核代碼過於復雜,他們不再追求 CPU/微體系結構的特定優化。未來是否會有任何專註於 ARM Linux 的發行版自身攜帶此類補丁,或者任何經過 AmpereOne 優化的 Linux 發行版繼續向前發展值得關註。特別是考慮到 Ampere 專註於高性能和高能效的 ARM Linux 服務器很可能不希望留下任何優化的痕跡,尤其是考慮到他們的目標是與 AMD EPYC 和 Intel Xeon 服務器競爭。


相關推薦

2023-03-16

有關聯,另外,現在有一個被選中的俄羅斯開發者的Linux內核貢獻被阻止。由於許多開源項目允許使用假名,而且不一定明確與政府或公司的關系,甚至是他們的實際位置,因此在社區驅動的項目中處理制裁問題更具挑戰性。傳

2022-07-25

也是建構在整個互聯網的協助之上的。如果有人統計Linux內核的貢獻者,會發現這約等於寫一本全球IT廠商點名冊:英特爾、Google、IBM、英偉達、Red Hat……然而,很多人不知道的是,在這些Linux內核的貢獻者中,華為的排名已經

2024-02-19

為 Linux 中發現的漏洞的 CVE 編號機構 (CNA),後續至少關於內核方面的漏洞,將由 Linux Kernel 項目自行分配,不再由 MITRE 分配 CVE 編號。為什麼會引起不滿呢?Linux Kernel 項目組認為整個系統 (指的是漏洞披露系統) 很多方面都被破

2022-09-13

2018 Prodigy 一樣,2022 Prodigy 的目標是極高的時鐘速度和高內核數。事實上,這些目標已經被提高,時鐘速度從 4 GHz 提高到 5.7 GHz,內核數從 64 增加到 128。本文中我們將更深入地解細節。02再見捆綁包,你好 Sane ISATachyum 最初試圖

2022-07-24

全漏洞提供緩解措施,但這些緩解措施目前隻適用於x86_64內核,如果在受影響的硬件上運用傳統的x86內核,則這些安全措施無法發揮作用。除非有熱情的個人站出來,否則它不可能得到修復,因為上遊的開發者和供應商早已轉向

2022-08-01

夠納入這些變化。Asahi Linux開發團隊發現,Torvalds在給Linux內核郵件列表的一封電子郵件中通過關於使用蘋果產品的評論。在周日發佈的郵件中,Torvalds寫道:"這裡最有趣的部分是我在arm64筆記本電腦上做發佈(並且正在寫這

2023-11-09

V峰會上發佈其第二代服務器CPU——VeyronV2,在指令擴展、內核設計、互聯標準、制程工藝等眾多方面進行全面升級。官方宣稱其性能超越AMD的高端服務器芯片Epyc 9754,堪稱最強RISC-V服務器CPU!同時,Ventana還能夠讓客戶將定制加

2022-10-10

至少對解開glibc LoongArch的主線來說已經很好,從那時起,內核團隊繼續為這個基於RISC-V和MIPS64的Loongson開發的IP進行其餘方面的啟用工作。在Linux 6.1中已經包含EFI啟動對LoongArch的支持,隨之而來的是對Linux的EFI代碼的一些清理,以

2022-06-29

能比A710提升5%。此外,由於放棄瞭aarch32指令集,因此A715內核的面積效率大漲,隻需要A710的1/4面積,總體性能雖然提升不大,但能效及面積效率大漲。最後就是A510小核的架構瞭,現在的是A510 v2相比2020年的A510變化也不算大,重

2023-11-28

,提升性能主要是兩條路,一個是提升主頻,一個是優化內核設計。但是由於目前國內先進制程工藝發展受限,龍芯3A6000依然是基於成熟工藝打造的,其性能的提升主要是通過設計優化來提升性能。所以我們可以看到,3A6000性能

2022-08-26

障嫌疑的 CPU / 核心。若經常發現某一顆處理器、或特定內核遇到 Segmentation Fault,打印下的內容將有助於排場插槽或 CPU 核心問題。Rik van Riel 在公告中寫道:在規模足夠大的計算機群中,壞掉個別 CPU 還是相當常見的。按照設想

2022-08-01

是他首次在運行AArch64M1芯片的蘋果MacBook筆記本上發佈該內核。Linux Kernel 5.19 引入大量新功能、新特性,在對新硬件方面添加對 LoongArch CPU 和 Zen 4 CPU 的支持,繼續改善對 AMD RDNA 3 和 Intel DG2/Alchemist 的支持,為 Alder Lake 添加英特爾

2024-02-13

在即將到來的Linux6.9周期中,64位Arm(AArch64)little-endian內核將支持Rust內核代碼。通過"next/rust-for-arm64"在ARM64開發樹中排隊的補丁是為讓RustARM64/AArch64支持Rust內核代碼到達終點線。提交說明顯示:"此提交為 Rust

2024-04-17

用於構建扁平鏡像樹(FIT)。扁平鏡像樹是編譯後的Linux內核與相關的設備樹(DeviceTree)內容配對,這些內容經過壓縮,可以很容易地分發並由有能力的引導加載程序執行。扁平鏡像樹鏡像可由 U-Boot、LinuxBoot、Coreboot 和其他啟