最近在貼吧和一些相關論壇中,有關固態硬盤“0E”的討論成為熱門話題,討論指向某些型號的NVMe固態硬盤正頻繁出現S.M.A.R.T.信息中“0E”與“03”兩項的異常值,而這兩個現象意味著這類NVM存儲介質正在出現非正常壽命損耗范疇內的“壞塊”,繼續使用將對用戶存儲數據的安全和完整帶來很大影響。
要想知道如何查看0E與03,我們先要對S.M.A.R.T.這項固態硬盤的“自我檢測分析與報告技術”有所解。簡單來說,這項技術可使硬盤測量自身的健康指標,並將數值向操作系統與用戶的監控軟件開放,不過每個硬盤生產商也有權決定哪些指標需要測量,以及為其設定各不相同的安全閾值,作為一項行業標準,S.M.A.R.T.已經成為多種硬盤產品的標配,其各項健康指標所使用的ID代碼,也隨硬盤種類的不同而存在各自的定義。
我們要討論的0E與03就是NVMe固態硬盤S.M.A.R.T.信息中的“媒體與數據完整性錯誤計數”與“可用備用空間”,可以使用我們熟悉的CrystalDiskMark來查看它們,正如下圖所示,這是筆者將一塊替換下來的OEM固態通過硬盤盒連接至電腦後,軟件顯示的結果。
可以看到底下的信息欄中第三行與倒數第二行分別是我們要查看的0E與03,但它們顯示的值包含一長串0、其他數字和字母,這是因為S.M.A.R.T.信息目前以十六進制顯示,我們可以在軟件中設置以十進制顯示,此外也可以設置屬性名稱以英文顯示,方便我們查找相關資料。
十進制顯示方式的設置在頂部菜單欄中的功能-高級設置-原始值-10[DEC],隨後我們看到的就是如下圖更易讀的十進制信息。
可以看到,這塊固態硬盤的03與0E值分別為100(百分比)和0(次數),處在正常狀態,長期讀寫使用並未使其產生壞塊等現象,我們也可以查看其他信息,包括嚴重警告標志的計數、已用壽命百分比(也會在左上角的健康狀態中顯示)、不安全關機計數等等。
更值得擔憂的是當前網友和用戶曝光出的眾多0E開始計數的情況,固態硬盤的壞塊是不可逆的,並且從存儲原理上來說,壞塊必然會影響存儲數據的完整性,導致文件損壞或丟失,正如0E這個ID的具體意義:主控檢測到未恢復的數據完整性錯誤的次數。
當有糾錯引擎無法校正的ECC、CRC校驗失敗或者LBA標簽不匹配錯誤發生時,0E數值會增加,隻要它不為0,就代表固態硬盤已經不再處於穩定的工作狀態。同時,0E的增加也伴隨著03可用備用空間的減少,如果這個百分比數值降低到0,就意味著可用於替換壞塊的閃存備用塊已經用盡。因此難怪有人認為0E是NVMe固態硬盤的“絕癥”,因為它既代表非正常使用壽命的損耗,也具有不可逆轉性,0E的數值大小沒有程度上的區別,因為數據損壞對用戶而言即使是僅有一次也可能帶來不可預料的後果。
讀者們可以根據上文提供的步驟來解自己的NVMe固態硬盤健康狀況,如果真的出現0E計數,筆者的建議是不再將其作為系統盤等主盤使用,盡快備份、轉移數據,並盡快尋求產品售後。對用戶而言固態硬盤的壞塊不是一個能通過維修解決的問題,保證數據的完整,同時獲得相應退換貨服務就是最好的結果。
0E計數以及其代表的壞塊現象,成因目前還存在多種推測,但貼吧等論壇網友歸納出的初步規律,包含某些型號存儲顆粒以及部分版本的硬盤固件有更高產生此類現象的概率,想要深入解的朋友可以自行查找。