Raid5兩塊硬碟離線導致伺服器癱瘓的解決方法

北亞資料恢復發表於2018-04-11
伺服器資料恢復背景描述:
需要進行資料恢復的磁碟陣列是兩組分別由4塊600G容量的SAS硬碟組成的raid5磁碟陣列,ext3檔案系統、lvm結構。
磁碟陣列中1號硬碟離線,熱備盤啟動同步,在同步過程中同raid中3號硬碟故障掉線,該組Raid陣列崩潰,LVM結構不完整,檔案系統無法正常使用,伺服器癱瘓。管理員檢查了掉線的兩塊硬碟,1號硬碟無法識別,3號硬碟可以識別。

磁碟陣列資料恢復方案:
首先對故障硬碟進行修復,這一步需要藉助資料恢復軟體對故障硬碟進行備份,然後將raid陣列中未掉線的所有硬碟和另一組正常的raid陣列進行全盤備份。
然後工程師分析raid中的相關資訊,根據raid資訊重新組建陣列,找到LVM資訊,重組LVM卷,再進一步分析EXT3檔案系統,恢復並匯出全部資料。

資料恢復過程:
1、首先由硬體資料恢復工程師對無法識別的1號硬碟記性開盤檢測,硬碟碟片磨損非常嚴重,無法進行資料恢復,在後續的資料恢復過程中只能按照缺盤狀態進行處理。
2、藉助資料恢復軟體對掉盤raid陣列和正常陣列全部進行全盤備份,資料備份情況如下:
磁碟陣列資料恢復

3、根據備份資料對原raid磁碟陣列中的校驗方式、條帶大小,硬碟盤序等資訊進行分析,並根據分析的得出的raid資訊重組出兩組raid陣列。重組raid截圖如下:
Raid5兩塊硬碟離線導致伺服器癱瘓的解決方法

4、工程師將兩組raid重組完成後開始分析底層資料,嘗試分析出lvm結構相關資訊並匯出作為pv的lun,藉助資料恢復軟體重組pv並重新生成lvm邏輯卷,過程如下:
Raid5兩塊硬碟離線導致伺服器癱瘓的解決方法

5、LVM重組之後,對LV(邏輯卷)中的EXT3檔案系統進行解析,恢復並匯出其中的全部資料。資料恢復結果如下:
Raid5兩塊硬碟離線導致伺服器癱瘓的解決方法

raid資料恢復結果:
由於陣列中的1號硬碟碟片劃傷嚴重無法修復,且部分硬碟中存在壞道,raid結構中可能存在缺陷,但大部份檔案經驗證後恢復成功。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2152806/,如需轉載,請註明出處,否則將追究法律責任。

相關文章