伺服器資料恢復-RAID5常見故障的資料恢復方案

北亞資料恢復發表於2023-10-16

raid5陣列常見故障:

1、伺服器硬體故障或者RAID陣列卡故障;

2、伺服器意外斷電導致的磁碟陣列故障;

3、伺服器RAID陣列陣列磁碟出現物理故障,如:電路板壞、磁頭損壞、盤面劃傷、壞扇區、韌體壞等;

4、誤操作導致磁碟盤序出現錯誤;

5、raid在同步資料或者重建過程中,同組raid陣列中又有其他硬碟掉線導致同步失敗。


RAID5磁碟陣列出現故障後需要注意的問題:

1、發現RAID5磁碟陣列發生故障或者資料丟失,建議不要盲目進行rebuild操作。

Rebuild:透過陣列的校驗功能,根據陣列內其他正常硬碟中的資料,計算&生成損壞硬碟中的資料,然後同步到熱備盤中。Rebuild操作適用於raid5陣列中有1塊硬碟掉線的情況。針對raid5陣列中有2塊磁碟掉線的情況:如果第一塊硬碟掉線後伺服器有寫入操作,第一塊掉線的硬碟資料在掉線後就不更新了。rebuild只能對先掉線的磁碟做Rebuild,如果對後掉線的磁碟做Rebuild操作,則部分陣列雖然能正常工作,但會出現資料錯亂,某些檔案無法開啟的情況。

2、RAID5陣列中硬碟掉線,建議不要盲目進行強制上線操作。

從北亞企安資料恢復工程師做過的海量RAID5陣列資料恢復案例中來看,有部分raid5陣列資料丟失的原因是陣列中有一塊硬碟離線後沒有及時更換硬碟,此後伺服器出現故障或者伺服器重啟,原來離線的硬碟重新上線,而原本線上的硬碟反而故障離線,資料不能正常使用。

使用者對後離線的硬碟進行強制上線操作,磁碟陣列自動同步,導致資料新舊混亂,伺服器資料丟失。市面上多數品牌和型號的陣列卡在原先離線磁碟自動上線時會檢查校驗資訊,一旦發現校驗資訊不正確就會重新計算校驗資訊,無法在缺盤的情況下恢復資料。

3、千萬不要進行初始化操作。

初始化類似於低階格式化,一旦對陣列進行初始化操作,這個陣列內所有硬碟的底層資料會被全部清零,導致陣列資料無法恢復。

4、重新配置陣列資訊時要保持與原陣列配置資訊一致。

一旦重新配置磁碟陣列的資訊與原始磁碟陣列的資訊不一致,陣列內多數檔案將無法開啟,導致資料丟失。多數伺服器都具有重新配置陣列資訊後自動初始化的功能,這將導致資料無法恢復。

5、在進行任何資料恢復操作前,務必將伺服器內的所有硬碟以只讀方式進行扇區級的映象備份,避免破壞原始資料。


RAID5資料恢復方案:

1、將故障伺服器中所有磁碟編號後取出,由硬體工程師對所有磁碟進行硬體故障檢測。針對不存在硬體故障的磁碟,以只讀方式做映象;對於存在硬體故障的磁碟,由硬體工程師處理後使用專門的工具做映象備份。

2、基於映象檔案分析底層資料,根據分析底層資料獲取到的RAID5陣列結構相關資訊重組raid5陣列,然後匯出資料。

3、驗證匯出的資料,確認資料無誤後重新搭建環境,將恢復出來的資料遷移到準備好的伺服器環境中。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2989128/,如需轉載,請註明出處,否則將追究法律責任。

相關文章