LPC 2022:Linux內核實時補丁在數百萬臺Meta服務器上運行良好


在本周的LPC2022大會上,Meta/Facebook披露旗下的數百萬臺服務器,已轉向使用RedHat的Kpatch內核實時補丁(KLP)解決方案。同時Meta工程師分享他們在這項實時補丁基礎設施上取得的成功,以及在此過程中遇到的麻煩。可知與大多數組織一樣,這項轉進旨在減少內核更新導致的服務器停機時間——尤其是無止境的安全更新流程。

(via Phoronix)

熟悉服務器應用場景的朋友,一定不會對冗長的開機自檢(POST)和完全重啟所需的時間感到陌生。

而通過引入內核實時修補方案,當一切按計劃進行時,服務器將能夠實現近乎無縫的新內核遷移。

具體說來是,livepatching 允許內核函數在運行時安全地實施就地修補。

而除內核基礎設施,Meta 還選用 Red Hat 的 Kpatch 解決方案。

同時 SUSE 有在持續維護 kGraft,Oracle 也有提供 Ksplice 方案。

不過在針對數百萬臺服務器的 Linux 實時補丁試驗過程中,Meta 工程師們也追蹤記錄需要克服的一些問題(比如性能方面)。

報告的內容,主要涉及在實時修補更高的 I/O、fsync 延遲、以及 TCP 重傳率期間,可能出現持續 1~2 秒的問題。

Meta 工程師們一直在努力應對極端狀況,尤其是更好地處理 Clang 編譯的 PGO 優化內核構建等方面、以及其它有助於提升穩健性的項目。

最後,對 Meta 大規模內核修補工作感到好奇的朋友,可移步查看 LPC 2022 大會的幻燈片和完整視頻記錄。


相關推薦

2022-09-14

x6.1中並入主流的Multi-GenLRU項目的最新進展。作為當前Linux內核頁面回收代碼的一個更好替代方案,如果MGLRU能夠在2022的最後一個完整內核周期內登陸Linux6.1,那它也將成為年內最激動人心的創新之一。Phoronix 指出,從 ChromeOS / Andr

2022-08-15

的合並窗口,LinusTorvalds終於趕在周日下午發佈Linux6.0主線內核的首個“候選發佈”(rc1)版本。在接下來的大約兩個月內,團隊將專註於Linux6.0內核的穩定性改進。不過從Phoronix的早期測試體驗來看,其已在各種系統上表現得相

2022-09-13

項目的最新進展。可知作為從用戶空間或eBPF程序控制Linux內核調度程序的一種方法,Ghost提供相當廣泛的API。對於開發者來說,他們還可根據系統偏好,而對調度行為進行微調。在周一的 LPC 2022 Dublin 線下活動期間,Google 工程師

2022-07-25

也是建構在整個互聯網的協助之上的。如果有人統計Linux內核的貢獻者,會發現這約等於寫一本全球IT廠商點名冊:英特爾、Google、IBM、英偉達、Red Hat……然而,很多人不知道的是,在這些Linux內核的貢獻者中,華為的排名已經

2023-11-22

其運行的方法,它提供數千個單獨的參數,可以調整開源內核管理資源的方式。這種調整方式可以更快捷地提高運行性能,而不需要重新編譯內核,但這仍然是一項具有挑戰性的工作,即使對於最熟練的自由和開放源碼軟件編程

2022-09-18

爾AlderLake處理器的過去一年裡,英特爾工程師已經對Linux內核進行一些改進,以便更好地處理混合P核與E核的混合處理運算方法。雖然AlderLake在最近版本的內核中運行得很好,而且Linux上的P核與E核的任務選擇比推出時要更完善,

2022-09-16

·沃恩-尼克爾斯(StevenVaughan-Nichols)今日撰文,在2022年內核開發者峰會LinuxPlumbersConference(LPC)上,對萊納斯·托瓦茲(LinusTorvalds)進行采訪。尼克爾斯和托瓦茲是幾十年的老朋友,隻是受疫情影響兩人在最近幾年都沒有碰過面

2022-07-24

bleed是一個例外。在Retbleed被公開近兩周後,圍繞它的Linux內核補丁修復工作仍在繼續,今天在Linux5.19-rc8之前有更多的補丁被送來,以解決緩解處理帶來的影響。這次的Retbleed補丁有點粗糙,許多問題直到這次投機執行攻擊被公開

2022-08-27

正在逐漸縮短與 Windows 11 的性能差距。基於 5.18 版 Linux 內核實測表明,Alder Lake-S 酷睿 i9-12900K 處理器在 Ubuntu 發行版上的表現,已較 Windows 11 幾乎沒有任何差異。與此同時,由英特爾 Linux 工程師 Racardo Neri 提交的新補丁可知,進

2022-08-11

擴展固件接口”(EFI)和ARM64的兩項顯著改進。首先,新內核接受華為在今年早些時候發佈的面向ARM64平臺的UEFI鏡像內存(MirroredMemory)支持。截圖(來自:git.Kernel.org)據悉,“統一可擴展固件接口”(UEFI)的鏡像內存支持,

2022-11-07

微軟為Linux內核提供的最新補丁是為擴展內核的支持,它允許在嵌套的微軟(MSHV)管理程序上運行,即運行多個Linux實例乃至在運行中的虛擬機系統內再多運行操作系統。微軟Linux團隊的Jinank Jain在周三發出一組補丁,以增加對在

2022-08-26

障嫌疑的 CPU / 核心。若經常發現某一顆處理器、或特定內核遇到 Segmentation Fault,打印下的內容將有助於排場插槽或 CPU 核心問題。Rik van Riel 在公告中寫道:在規模足夠大的計算機群中,壞掉個別 CPU 還是相當常見的。按照設想

2023-01-11

和服務,標志著銀河麒麟操作系統面向雲化的全面突破。內核由麒麟軟件深度自研開發,針對指令級別進行創新優化,性能表現提升5%以上。尤其針對企業關鍵業務場景進行性能調優,在數據庫讀寫、響應時間、計算負載等能力

2022-07-24

全漏洞提供緩解措施,但這些緩解措施目前隻適用於x86_64內核,如果在受影響的硬件上運用傳統的x86內核,則這些安全措施無法發揮作用。除非有熱情的個人站出來,否則它不可能得到修復,因為上遊的開發者和供應商早已轉向