最大的數據存儲雲公司之一Backblaze剛剛披露其年度硬盤故障報告,涵蓋他們內部以及合作夥伴和客戶使用的數據驅動器。該公司利用HGST、希捷、東芝和西部數據的數據驅動器,驅動器大小在4TB到16TB之間。在2022年年初,我們討論硬盤的壽命,西部數據是同名單中被消費者看好的公司。
今天,Backblaze披露他們在8月份采用的29種不同硬盤型號的2022年第二季度的統計數據。希捷公司在列出的硬盤中突出最明顯的變化。
最近一期分析報告的作者、Backblaze的首席雲存儲技術主管Andrew Klien指出,在去年年底,該公司管理著235,608臺硬盤,其中4,299臺為系統硬盤,231,309臺為數據硬盤。報告中不包括啟動系統的驅動器,因為消費者更經常使用數據驅動器。在231,309個驅動器中有388個被剔除,因為該公司將它們用於內部測試或少於60個物理單元。在今年年底,230,921個硬盤參與2022年的故障率分析報告。
上圖顯示Backblaze的硬盤在一年內的故障率。該公司再次使用29個不同的型號,其中希捷的14TB硬盤(ST14000NM0138)在使用的1519個硬盤中,故障率平均為5.7%。有趣的是,希捷這些硬盤的故障率的平均故障年齡(以月為單位)為24.8。硬盤故障率最低的也是希捷公司,他們的8TB硬盤(ST8000NM000A)比去年完全沒有損失。該型號的硬盤有79塊,使用天數最少,Backblaze指出,8TB希捷硬盤被用作其它8TB硬盤故障的備用硬盤。
有兩個型號的工作平均天數最多,一個來自希捷(6TB,ST6000DX000),一個來自東芝(4TB,MD04ABA400V)。兩者的平均天數都超過90個月,而且兩者之間的故障率也很高,盡管東芝隻有94臺硬盤在使用,而希捷有886臺。希捷硬盤持續工作八年時間令人印象深刻,每年的故障率不到1%,特別是在硬盤數量幾乎是其他樣本的八倍的情況下。
在過去的三年裡,平均故障率上升0.44%,Backblaze在報告的早期將其歸結為驅動器的年齡。然而,該公司進一步分解分析,看看平均故障率的增加是否是如此,首先是驅動器的大小和故障。
驅動器被分成兩類,一類是容量在10TB及以下的驅動器,另一類是12TB及以上的驅動器。小型硬盤的平均故障率增加0.85%,而大型硬盤的變化為+0.20%。Backblaze指出,與大型驅動器相比,小型驅動器占整體驅動器故障的44.5%。
以上述圖表為例,Backblaze將圖表轉換為兩個表格,第一個表格顯示所有驅動器尺寸的平均年齡(以月為單位)和終身平均故障率,即AFR。第二個表格進一步整合驅動器,列出較老的驅動器,以顯示故障的增加,這在2013年4月至2022年12月的變化中更為突出。
在這部分分析的最後,長時間使用是導致該公司目前硬盤故障率增加的原因。在2023年,Backblaze預計將用更大的硬盤取代許多舊硬盤,從16TB以上開始,這意味著他們的小硬盤在使用中會少很多。
關於硬盤故障最嚴重的制造商,希捷和東芝在2020年第一季度數據開始接近持平。然而,在去年第四季度末,希捷的平均故障比例最明顯。希捷也是Backblaze手裡工作時間最長的硬盤的制造商,所以出現大量的故障數是合理的。
這是否意味著希捷硬盤多年來一直在惡化,消費者應該避免使用它們?Klien指出,希捷的幾個型號都很有成本效益,隨著時間的推移很容易更換。但如果他們使用更高的硬盤存儲,並逐步淘汰舊型號,這些數字可能會改變。
總體來看,硬盤的終身故障率比上一季度減少0.01%和0.02%。事實上,在分析的226,041臺硬盤中,總共有333,011,602個硬盤工作日,總體上有12,722個硬盤故障。