帶電熱插拔硬碟造成硬碟故障

anycall2010發表於2008-07-03

前天解決一個硬碟故障:

使用者硬體環境:

   X255 伺服器,現在有6塊硬碟,將硬碟分2組,做成2個RAID5陣列。在第一組陣列安裝作業系統,在第二組陣列存放資料和軟體。在一個通道里建兩個陣列的原因是:(使用者這樣規劃的原因是:第一組又3塊36G的硬碟;第二組有3塊73G的硬碟)。使用者使用serverRaid 6M卡。

使用者出現的問題:

使用者想額外購買73G的硬碟,然後在生產機器上,隨手拔出一塊硬碟,看看硬碟的轉速和型別,結果出現了故障。

故障現象:

開機時,系統檢測到有硬碟OFFLINE。

解決的辦法:

一開始使用者給我打電話,問我可以不可以使用SERVERRaid 6M卡的硬碟迴寫功能,進行對陣列資訊的恢復。因為我一開始沒弄明白故障原因,所以建議使用者使用ServerRaid manager察看陣列狀況 :

1. 找到以前serverraid application CD,由於系統是正常的,登陸系統安裝ServerRaid manager.

2. 從ServerRaid manager 中看到:陣列1有一塊硬碟出現rebuilding的情況,陣列2的硬碟出現一塊DEFUNCT,另一塊出現 REBUILDING的情況。

3。陣列1和陣列2依然存在。

說明:陣列資訊沒有丟,沒有必要進行回寫。

隨後趕赴現場,經過多方面分析,得出一個結論:

使用者對熱插拔硬碟理解不夠,以為熱插拔硬碟就是機器執行過程中,進行硬碟熱插拔;使用者在插拔過程中,正好出現陣列1的一塊硬碟在陣列2的一塊硬碟中,讀寫資料。出現這樣的錯誤。明白了這個,我對OFFLINE的那塊硬碟,進行ONLINE操作。這個時候兩個陣列同時進行rebuilding 。。。。。

最後,陣列上的資料沒有丟失,故障圓滿解決。

 

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/8334342/viewspace-368950/,如需轉載,請註明出處,否則將追究法律責任。

相關文章