Linux 6.1將於十月迎來新補丁 有助於定位潛在故障的CPU插槽或核心


對於日常需要接觸並維護大量硬件的服務器管理員來說,這裡有個好消息——Linux6.1將能夠在發生SegmentationFault分段錯誤時,報告潛在有問題的CPU插槽/核心。當發現某個CPU/核心經常引發同樣問題的時候,這項新特性就能夠幫你更輕松的排查相關故障。

(截圖 via Kernel.org)

Phoronix 指出:當前正在 TIP 排隊的 x86 / cpu 分支合並窗口,將於 10 月份帶來一項改進。該補丁用於在分段錯誤發生時,記錄下有故障嫌疑的 CPU / 核心。

若經常發現某一顆處理器、或特定內核遇到 Segmentation Fault,打印下的內容將有助於排場插槽或 CPU 核心問題。Rik van Riel 在公告中寫道:

在規模足夠大的計算機群中,壞掉個別 CPU 還是相當常見的。按照設想,我們可通過內核代碼的運行來辨識,以找出在特定系統上不斷重復崩潰的 CPU 內核。

不過多年來,出現問題的 CPU 故障模式,並不是千篇一律的。有時你可能隻會揪出 bash、Python,或在在其它地方運行良好的各種系統守護程序中遇到分段錯誤。

有鑒於此,通過將 printk() 添加到 show_signal_msg(),我們便可在遇到 Segmentation Fault 時,打印出有潛在故障的處理器插槽或內核等信息。

盡管這項工作仍不夠完美 —— 因為在故障發生和打印消息之間,任務可能還會在另一個 CPU 上被重新安排 —— 但這項工作已足夠幫助人們定位到哪幾個可能有內核損壞的 CPU 上。

如果一切順利,這個實用補丁將於今年晚些時候正式並入 Linux 6.1 。此外你可將它視作英特爾現場掃描(Intel In-Field Scan)、MCEs、EDAC 報告等解決方案的一個有力補充。


相關推薦

2022-08-27

差異。與此同時,由英特爾 Linux 工程師 Racardo Neri 提交的新補丁可知,進一步的優化正在路上。(via Phoronix)據悉,新補丁主要改進大核(P-cores)性能、以及與小核(E-cores)之間的任務調度。在混用具有較高頻率的同步多線程

2023-03-14

早些時候,AMD承認,在Linux系統中開啟AMD銳龍處理器的fTPM,將可能導致系統出現間歇性的卡頓、死機等情況。據悉,該Bug在Linux 6.1內核中表現得最為明顯,這是因為因為在提案b006c439d58db(hwrng:core-也為不受信任的來源啟動hwrng kth

2022-09-27

給我們留下相當深刻的印象。可知針對io深度為1的隊列,新補丁可將吞吐量提升至兩倍以上。在 io 隊列深度為 4 的情況下,Btrfs 異步寫入補丁還可實現與現有代碼相同、或更好的性能表現。但若進一步增加 io 深度,則變化就沒

2022-09-13

C 服務器有望在 Hackbench、Schbench、Tbench 等各類工作負載上迎來性能的有效改進。不過由於該系列補丁仍處於實驗階段,推測最終用戶需要等待數月,才會看到它已做好被添加至 Linux 內核中的準備。

2022-10-18

英特爾已經發佈GNU編譯器集合或GCC的新補丁,這將有助於支持即將到來的MeteorLake和SierraForestCPU。GCC包括幾種編碼語言和庫,如C、C++等,為利用Linux、Ubuntu等操作系統的用戶提供一個開源的編譯選項。英特爾提供的新編譯器更新

2023-06-14

針對Linux推出v2版集群調度補丁。根據Intel官方介紹,通過新補丁的集群調度代碼,Linux系統下的進程調度水平獲得提升,這將提升Intel 12代及之後CPU在Linux系統上的性能。Intel稱,在2021年的Linux 5.16版本中,CPU集群調度存在一定問

2022-10-13

動。現在,Linux6.1內核又為源自MIPS64和RISC-V的LoongArchCPU帶來新的附加功能。(圖自:龍芯官網)幾天前,開發人員已經搞定 LoongArch EFI 引導,為 Linux 6.1 的 EFI 機密計算做好準備。而周三的主要工作,主要涉及 LongArch CPU 的移植更

2022-10-11

Phoronix報道稱:作為一款性能分析工具,Linux6.1中的“perf”內核子系統,剛剛添加對AMDCPUCache-To-Cache和內存報告功能的支持。其中perfmem用於各種內存統計,而perfc2c則用於CPU的緩存到緩存信息。(來自:git.Kernel.org)Phoronix 指出,

2022-08-29

合到當前分支的“perf”子系統中。Linux 6.1 的合並窗口期將於 2022 年 10 月開放。Last Branch Record(LBR)功能通過將分支信息實時記錄到寄存器來確定和分析軟件的控制流。分支信息將允許系統決定“熱代碼”應該指向哪些路徑,例

2022-10-23

一組"x86/緊急"補丁今天早上被送出,以便在今天的6.1-rc2版本之前拉入Linux內核。這個x86/緊急拉動請求有一些影響Linux內核x86/x86_64CPU代碼的修復。有一些拓撲結構的修復,各種編譯器處理檢查的清理,英特爾per

2023-12-02

好達到Linux的上限。為此,Ampere已經向Linux內核提交一個新補丁,采用一種名為“CPUMASK_OFFSTACK”的方法,可以簡單地理解為一種映射關系,從而繞過核心數量限制。最關鍵的是,這種方法不會給Linux內核鏡像增加過多負擔,每個

2022-09-28

中領導Rust編程語言基礎支持工作的MiguelOjeda今天發佈這些補丁的第十個版本。這些Rustv10補丁預計最快將在下周與Linux6.1內核合並的窗口中進入主線。對Linux內核的Rustv10支持包括27個補丁,共計12.5萬行新代碼。這些補丁包括為內核

2024-02-08

7.0,這些功能的目的是讓數據管理和內部通信更加順暢。新補丁並不包括任何令人興奮的內容,而是傳統的支持,遺憾的是,新添加的內容並沒有告訴我們有關RDNA 4 GPU新陣容的任何信息。RDNA 4 的發佈還遙遙無期,我們接下來有

2022-08-06

字、並在卸下時使用‘pr_info!’宏將之打印到內核日志。新補丁系列還可通過移除其中部分內容而變得更小,目前看來其取得不錯的平衡。最終得來 3% 的 kernel crate 留存(減少到 500 行),60% 的 alloc 和 adapt alloc 提交(100 行),