儲存崩潰資料恢復過程;資料恢復案例

北亞資料恢復發表於2020-10-09

一、儲存故障描述

我中心接到某公司一臺EMC儲存資料恢復。經初步瞭解,這臺儲存共包含12塊硬碟,組成raid5磁碟陣列,包含熱備盤2塊,單盤容量為1TB,由於硬碟故障導致儲存崩潰。

二、硬碟物理檢測及儲存資料備份

工程師對客戶儲存內的所有硬碟進行物理檢測,未發現壞道等其他物理故障,隨後使用winhex將儲存內的所有磁碟進行了備份,備份完成後將客戶的原始儲存交還給客戶,接下來將在映象檔案中進行資料恢復操作。

三、儲存資料恢復過程

由於客戶的儲存底層結構為raid5磁碟陣列,正常情況下,raid5陣列如果崩潰,則陣列中至少有2塊硬碟掉線,而在物理檢測過程中又並未發現有硬碟存在物理故障,所以在本次資料恢復中只需分析底層raid結構,虛擬重組即可。

1.分析raid結構

經恢復中心工程師對映象檔案進行分析,最終得出raid陣列的硬碟盤序、條帶大小、分步規律等。並分析發現該儲存原始陣列中的兩塊熱備盤中均未寫入任何資料。

2.分析raid陣列掉線盤

根據分析得出的riad5磁碟陣列基本資訊,工程師透過自研發的raid5陣列重組工具將raid陣列進行虛擬重組。然後分析LUN在RAID組中的分配資訊,以及LUN分配的資料塊MAP。在本次儲存資料恢復中,上層儲存有一個lun,資料恢復工程師對這個lun資訊進行解析並匯出lun資料即可。

3.解析zfs檔案系統

利用自主研發的zfs檔案系統解析工具對lun檔案系統進行解析,經解析發現由於儲存癱瘓導致部分檔案系統的元檔案被破壞,工程師手動對這些被破壞的檔案進行修復,最終zfs檔案系統被正常解析。

4.匯出儲存內的所有資料

Zfs檔案系統解析成功後,繼續對儲存中的檔案節點、目錄結構等進行解析並匯出,工程師對匯出的資料進行驗證,驗證資料正常未出現報錯。

四、儲存資料恢復成功

經過客戶親自對恢復結果進行驗證,最終確認客戶儲存內的所有資料全部恢復成功。

由於客戶儲存發生故障後對現場環境進行了保護,沒有任何其他操作,這使後期的資料恢復工作避免了很多不必要的麻煩,一定程度上也增加了資料恢復的成功率。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2725818/,如需轉載,請註明出處,否則將追究法律責任。

相關文章