我在前兩篇部落格中提到了硬碟的生命週期和可靠性。這兩篇文章本是我們在尋找最具價效比的硬碟時的副產物。運營一個每個月5美元的真正無限制線上備份服務意味著我們的雲端儲存空間需要非常高效,我們需要儘快找出哪種硬碟可以勝任。
因為Backbalze有著開放的傳統,許多讀者希望我在之前的文章裡再講一些細節。它們想知道哪種硬碟效能最好,哪種硬碟有更長的壽命。以我們接觸過的25000個硬碟的經驗,它們想知道哪些硬碟好用到我們會再次購買。在這篇文章裡,我將一一作出解答。(譯註:Backblaze 是一家提供線上資料備份的公司。)
硬碟統計
在2013年底,我們在Backbalze的儲存池中,使用了27134個普通消費者級硬碟,根據品牌的統計如下:
Hard Drives by Manufacturer Used by Backblaze | |||
品牌 | 使用數量 | TB數 | 平均使用年數 |
希捷 | 12,765 | 39,576 | 1.4 |
日立 | 12,956 | 36,078 | 2.0 |
西部資料 | 2,838 | 2,581 | 2.5 |
東芝 | 58 | 174 | 0.7 |
三星 | 18 | 18 | 3.7 |
你可以看到,我們大多用的都是希捷和日立,也有很多西部資料。我們沒有很多東芝還有三星的硬碟可以提供好的統計資料。
我們為什麼買這些硬碟呢?基本上,我們只買最便宜的能工作的硬碟。當一個新的硬碟上市後,看起來質量不錯而且價錢便宜,我們就買回來組成儲存池,測試它們的效能。新的硬碟會經歷初始設定的測試,壓力測試,最後是在產品用執行幾個星期。(幾個星期就足夠把硬碟池寫滿資料了。)如果情況號的話,這塊硬碟就進入我們的購買清單了。當價錢合理的時候,我們就買下來。
我們也希望多畫一點點來買更可靠的硬碟,因為要是換一塊硬碟的花銷更大。我們可不想花太多的錢。
排除的硬碟
有些硬碟實在無法在Backbalze的環境裡執行。我們沒有對它們進行研究。如果僅僅因為硬碟無法適應某個環境就說這是個壞硬碟是不公道的。
我們在硬碟池中有一些這樣的硬碟,但是這些硬碟都在更換的過程中,因為它們都不夠可靠。如果整個RAID(冗餘磁碟陣列)都是不可靠的硬碟時,當一塊硬碟壞掉就要費很多工作來讓RAID重新上線工作。為一塊硬碟實在太不值了。
我們的環境下工作了的硬碟是希捷資料綠色(環保,低功耗)3TB硬碟和希捷LP(低功耗)2TB硬碟。這兩種硬碟一放入我們的產品就會開始產生錯誤。我們認為這是震動的緣故。這兩種硬碟在低震動的Backbalze儲存池中會表現更好一些,但是還不夠好。
這些硬碟本來被設計為低功耗的,在沒有使用時主動降速。在Backblaze的環境下,它們經常減速,又恢復速度。我們認為這造成了硬碟的勞損。
故障率
我們通過觀察一年的故障率來測量硬碟的可靠性,即一塊硬碟一年的平均故障次數。故障意味著我們要在儲存池中更換硬碟。
這張表中還有很多希捷沒有體現,包括我們擁有硬碟型號的統計數量,以及硬碟使用年數。
按型號統計Backblaze使用的硬碟 | ||||
型號 | 大小 | 使用數量 | 平均使用年數 | 年故障率 |
Seagate Desktop HDD.15 (ST4000DM000) |
4.0TB | 5199 | 0.3 | 3.8% |
Hitachi GST Deskstar 7K2000 (HDS722020ALA330) |
2.0TB | 4716 | 2.9 | 1.1% |
Hitachi GST Deskstar 5K3000 (HDS5C3030ALA630) |
3.0TB | 4592 | 1.7 | 0.9% |
Seagate Barracuda (ST3000DM001) |
3.0TB | 4252 | 1.4 | 9.8% |
Hitachi Deskstar 5K4000 (HDS5C4040ALE630) |
4.0TB | 2587 | 0.8 | 1.5% |
Seagate Barracuda LP (ST31500541AS) |
1.5TB | 1929 | 3.8 | 9.9% |
Hitachi Deskstar 7K3000 (HDS723030ALA640) |
3.0TB | 1027 | 2.1 | 0.9% |
Seagate Barracuda 7200 (ST31500341AS) |
1.5TB | 539 | 3.8 | 25.4% |
Western Digital Green (WD10EADS) |
1.0TB | 474 | 4.4 | 3.6% |
Western Digital Red (WD30EFRX) |
3.0TB | 346 | 0.5 | 3.2% |
Seagate Barracuda XT (ST33000651AS) |
3.0TB | 293 | 2.0 | 7.3% |
Seagate Barracuda LP (ST32000542AS) |
2.0TB | 288 | 2.0 | 7.2% |
Seagate Barracuda XT (ST4000DX000) |
4.0TB | 179 | 0.7 | n/a |
Western Digital Green (WD10EACS) |
1.0TB | 84 | 5.0 | n/a |
Seagate Barracuda Green (ST1500DL003) |
1.5TB | 51 | 0.8 | 120.0% |
下面的部分將重點講這些結果的不同方面。
1.5TB 希捷硬碟
Backblaze團隊很喜歡希捷Barracuda低功耗1.5TB硬碟。我們已經執行它很長時間了——它們的平均年齡已經快4年了。它們的整體故障率不好,但也不是很嚴重。
非低功耗的7200轉硬碟一直不可靠。它們的故障率非常高,尤其是年頭長了的時候。
Backblaze使用的1.5TB希捷硬碟 | ||||
型號 | 大小 | 使用硬碟數量 | 平均使用年數 | 年故障率 |
Seagate Barracuda LP (ST31500541AS) |
1.5TB | 1929 | 3.8 | 9.9% |
Seagate Barracuda 7200 (ST31500341AS) |
1.5TB | 539 | 3.8 | 25.4% |
Seagate Barracuda Green (ST1500DL003) |
1.5TB | 51 | 0.8 | 120.0% |
然而希捷的Barracuda 1.5TB綠版硬碟執行得不是那麼好。我們通過希捷的質保用舊硬碟換來這些新硬碟,但是新硬碟卻總是罷工。它們的平均使用年數為0.8年,但是因為這些是質保換新的,我們認為這些都是其他使用者返廠後擦除翻新的硬碟,所以我們拿到手的時候它們已經不是新硬碟了。
更大的希捷硬碟
更大的希捷硬碟延續了1.5TB硬碟的傳統:它們都效能不錯,但是也有同樣的損耗造成的故障。
Backblaze使用的2TB至4TB硬碟 | ||||
型號 | 大小 | 使用數量 | 平均使用年數 | 年故障率 |
Seagate Desktop HDD.15 (ST4000DM000) |
4.0TB | 5199 | 0.3 | 3.8% |
Seagate Barracuda (ST3000DM001) |
3.0TB | 4252 | 1.4 | 9.8% |
Seagate Barracuda XT (ST33000651AS) |
3.0TB | 293 | 2.0 | 7.3% |
Seagate Barracuda LP (ST32000542AS) |
2.0TB | 288 | 2.0 | 7.2% |
Seagate Barracuda XT (ST4000DX000) |
4.0TB | 179 | 0.7 | n/a |
希捷硬碟便宜的價格,並不完美但穩定的表現是我們大量選擇他的原因。
日立硬碟
如果價錢再便宜一點的話,除了日曆的硬碟我們什麼都不會買的。它們像石頭一樣牢固,並且故障率極低。
Backblaze使用的日立硬碟 | ||||
型號 | 大小 | 使用硬碟數量 | 平均使用年數 | 年故障率 |
Hitachi GST Deskstar 7K2000 (HDS722020ALA330) |
2.0TB | 4716 | 2.9 | 1.1% |
Hitachi GST Deskstar 5K3000 (HDS5C3030ALA630) |
3.0TB | 4592 | 1.7 | 0.9% |
Hitachi Deskstar 5K4000 (HDS5C4040ALE630) |
4.0TB | 2587 | 0.8 | 1.5% |
Hitachi Deskstar 7K3000 (HDS723030ALA640) |
3.0TB | 1027 | 2.1 | 0.9% |
西部資料硬碟
在Backblaze剛開始的時候,我們買的西部資料1TB硬碟,這個選擇非常明智。即使在使用了4年以後,我們還在使用的硬碟仍然效能不俗。
我們也很想要更多的西部資料Red 3TB硬碟。這個硬碟也很好,但是上市的時候我們已經大量購買了希捷3TB硬碟,而且價格也更高一些。
使用的西部資料硬碟 | ||||
型號 | 大小 | 使用硬碟數量 | 平均使用年數 | 年故障率 |
Western Digital Green (WD10EADS) |
1.0TB | 474 | 4.4 | 3.6% |
Western Digital Red (WD30EFRX) |
3.0TB | 346 | 0.5 | 3.2% |
Western Digital Green (WD10EACS) |
1.0TB | 84 | 5.0 | n/a |
那硬碟沒有完全失效會怎麼處理?
執行一個大型資料中心的另一個重要問題在於,每塊硬碟需要多少員工去照料。當一塊硬碟出了毛病,但沒有完全失效時,他還是能工作的。有時候自動恢復的機制可以修復這些問題,但是有時候一個RAID陣列需要人工修復來重新工作。
每個儲存池都執行著一個RAID陣列。每個陣列通過把資料儲存在多個硬碟中來可靠地儲存資料。如果一個硬碟發生故障,資料仍然可以從其他硬碟中獲取。有時候,一個硬碟被RAID“彈出”,但是看起來沒什麼問題,那麼在檢查確認他的資料沒有受損且仍在工作,那麼就把他放回RAID中繼續執行。還有些時候硬碟完全沒有響應,好像死了一樣,但是仍可以在重置後繼續執行。
通過統計“故障”狀態的硬碟佔用的時間也就看出了一個硬碟需要多少工作去照料他。日立硬碟再次勝出。日立硬碟無故障執行時間達到99.99%,而其他的硬碟只有兩個9。
按製造商統計的Backblaze使用硬碟無故障執行率 | |||
Brand | Active | Trouble | Number of Drives |
Seagate | 99.72 | 0.28% | 12459 |
Western Digital | 99.83 | 0.17% | 933 |
Hitachi | 99.99 | 0.01% | 12956 |
根據品牌分析硬碟的壽命
下面的圖表顯示了按月統計的各個牌子的累計存活率。還有多少硬碟仍在工作?
日立硬碟真是棒。西部資料硬碟從一開始就有掛掉的,接下來曲線就平穩了。希捷硬碟一開始很強勁,但是持續高比率地出現故障,在20個月的時候有著極高的故障率。
但是話說回來,你會發現即使是三年後,到現在為止大多數硬碟仍然良好地工作著。
現在Backblaze在買什麼硬碟?
我們現在在為新的儲存池購買4TB硬碟。為此,我們當下最喜歡的硬碟是希捷桌面硬碟HDD.15(ST4000DM000)。然而,我們還會繼續檢視他的表現。以往來看,希捷硬碟一開始會表現優異,但在之後會有較高的故障率。
我們另一款喜歡的硬碟是西部資料3TB紅色(WD30EFRX)。
我們仍然需要買小硬碟來更替舊的硬碟池中壞掉的硬碟。我們絕對不會買的就是Western Digital 3TB Green drives和Seagate 2TB LP drives。
一年半之前,西部資料收購了日立硬碟業務。日立硬碟還會繼續保持優秀的表現麼?西部資料把日立硬碟的可靠性引入自己的消費級硬碟麼?
更正:日立的2.5寸硬碟業務被西部資料收購,3.5寸硬碟業務被東芝收購。
在Backblaze,我們會繼續監控並分享多種硬碟型號的表現。你有什麼經驗麼?