【北亞資料恢復】EMC儲存伺服器riad5硬碟故障掉線導致伺服器崩潰的資料恢復

北亞資料恢復發表於2022-02-24

環境:


EMC儲存伺服器;

10塊硬碟組成RAID5磁碟陣列。

故障:


RAID5磁碟陣列有3塊硬碟由於故障離線導致伺服器癱瘓。管理員新增了新硬碟做rebuild,但是沒有拔掉掉線的硬碟,服務

中有3塊多餘硬碟。


資料恢復過程:


1、伺服器管理員初步判斷伺服器癱瘓是因為陣列中硬碟出現硬體故障導致的,於是將所有硬碟交給北亞資料恢復中心進行

物理檢測。北亞硬體工程師對伺服器中所有硬碟進行檢測後沒有發現硬碟存在物理故障,把硬碟移交給北亞資料恢復工程師

進行處 理。


2、對所有磁碟進行映象備份後,北亞資料恢復工程師開始對伺服器raid結構進行分析。


3、北亞資料恢復工程師發現該伺服器中的硬碟每512位元組就多增加了一個8位元組的校驗,也就是每扇區520位元組。這種情況

下繼 續進行raid結構分析將十分困難。北亞資料恢復工程師編寫了一個小程式將8位元組的校驗去掉,方便後期的工作。


4、用這個小程式將所有磁碟都轉換完成後,北亞資料恢復工程師繼續分析RAID的結構。由於多了3塊舊盤,需要透過比較

每塊磁碟,即其中會有兩塊磁碟前面的一部分相同,而這兩塊磁碟中會有一個是舊的,由於舊的資料量沒有新盤多,所以數

據量少的 就是舊盤,按照這種思路可以分辨出新盤和舊盤。這樣的磁碟會有3對。


5、此伺服器使用的是NTFS檔案系統,可以用MFT弄清楚RAID結構。搞清楚RAID結構後,北亞資料恢復工程師發現這是一

個雙 迴圈RAID 5。因此無法藉助資料恢復工具重組RAID,北亞資料恢復工程師只好透過其他方式重組raid陣列。


6、重組RAID後發現資料不是最新的。北亞資料恢復工程師推斷出現這種問題的原因是:RAID5第一塊硬碟掉線的時候管理

員沒有及時發現,沒有及時新增新的硬碟做rebuild,導致伺服器執行一段時間後又有一塊硬碟掉線了,才造成整個RAID不

可用。所以還需要找出一塊舊的磁碟,才能生成最新的資料。


7、北亞資料恢復工程師採用窮舉加校驗的方法進行分析,即假設某個磁碟是掉線的,踢掉磁碟後重組RAID,但不是生成全

部的資料,而是隻生成前面5G的資料,我們只需要檢視這個索引表的點陣圖的資訊是否正確就可以判斷此RAID是否正確。如

果正確,那麼生成此RAID的資料即可完成RAID的重組。經過3天的努力,資料最終完全恢復。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2857563/,如需轉載,請註明出處,否則將追究法律責任。

相關文章