【儲存資料恢復】EMC某型號儲存raid5崩潰的資料恢復案例
儲存資料恢復環境:
北京某醫院的一臺EMC某型號儲存raid5崩潰;
儲存共12塊硬碟組成raid5(2塊熱備盤);
上層一個lun分配給sun小機,上層檔案系統是ZFS。
儲存故障:
故障儲存中有2塊硬碟出現故障,但只有1塊熱備盤啟用成功,raid5陣列癱瘓,上層lun無法使用。
儲存資料恢復過程:
1、資料恢復工程師檢測故障儲存中所有磁碟沒有發現物理故障和壞道。
2、使用工具將故障儲存中的全部磁碟映象備份。源磁碟的扇區大小是520位元組,需要把所有備份資料做520位元組 to 512字
節的轉換。
3、由於所有硬碟不存在物理故障和壞道,可以初步判斷故障是由部分磁碟讀寫不穩定造成的。因為EMC控制器有著非常嚴
格的檢查磁碟策略,如果磁碟出現效能不穩定的情況就會被EMC控制器判斷為壞盤並踢出raid陣列。當raid中掉盤數量超過
該raid所允許最大掉盤數量,raid癱瘓,導致raid的上層lun不可用。
4、EMC儲存的LUN都是基於RAID的,因此需要先分析底層RAID的資訊,然後根據分析獲取到的資訊重構原始RAID。對所
有硬碟資料分析,發現8號盤和11號盤完全沒有資料,8號盤和11號盤都是Hot Spare,但8號盤的Hot Spare替換了5號壞盤
。因此判斷8號盤(Hot Spare)雖然成功啟用,但RAID陣列中還缺失一塊硬碟,所以資料沒有同步到8號硬碟中。繼續分析
其他10塊硬碟的資料分佈規律、RAID條帶的大小和每塊磁碟的順序。
5、基於分析獲取到的RAID資訊,透過北亞自主開發的RAID虛擬程式將原始RAID虛擬出來。但由於故障RAID總共掉線兩塊
盤,因此需要判斷這兩塊硬碟的掉線順序。仔細分析所有硬碟中的資料發現有一塊硬碟在同一個條帶上的資料和其他硬碟明
顯不一致,因此可以初步判斷此盤是最先掉線的,透過北亞自主開發的RAID校驗程式檢測這個條帶發現除掉剛才分析的那塊
硬碟得出的資料是最好的,因此可以確定最先掉線的硬碟。
6、由於EMC儲存的LUN是基於RAID的,RAID重組出來後,資料恢復工程師開始分析LUN在RAID中的分配資訊以及LUN分
配的資料塊MAP。上層只有一個LUN,只需要分析一份LUN資訊,然後根據分析出來的資訊使用raid恢復程式解釋LUN的數
據MAP並匯出LUN的所有資料。
7、利用北亞自主開發的ZFS檔案系統解釋程式對生成的LUN做檔案系統解釋,但是在解釋某些檔案系統元檔案的時候有報錯
。於是開發工程師對該ZFS檔案系統解釋程式做debug除錯並分析程式報錯原因。檔案系統工程師分析ZFS檔案系統是否因為
版本原因導致程式不支援。經過數小時的分析與除錯,結果發現儲存突然崩潰導致ZFS檔案系統中某些元檔案損壞,從而導致
解釋報錯。
8、透過分析確認儲存癱瘓導致部分檔案系統元檔案損壞,只有修復好這些損壞的檔案系統元檔案才能正常解析ZFS檔案系統。
透過分析損壞的元檔案發現,儲存癱瘓的同時ZFS檔案系統正在進行IO操作,所以導致部分檔案系統元檔案沒有更新或者損壞。
資料恢復工程師對這些損壞的元檔案進行手工修復,保證ZFS檔案系統能夠正常解析。
9、修復好的ZFS檔案系統做解析,解析所有檔案節點及目錄結構。由使用者方工程師對資料進行驗證,驗證沒有發現問題,數
據完整可用。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2914970/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【伺服器資料恢復】EMC儲存raid5崩潰的資料恢復案例伺服器資料恢復AI
- 【儲存資料恢復】儲存上的raid5陣列崩潰的資料恢復案例資料恢復AI陣列
- 儲存崩潰資料恢復過程;資料恢復案例資料恢復
- 【伺服器儲存資料恢復】華為OceanStor某型號儲存raid5資料恢復案例伺服器資料恢復AI
- 【伺服器資料恢復】IBM某型號儲存RAID5資料恢復案例伺服器資料恢復IBMAI
- EMC儲存崩潰raid離線恢復資料方法AI
- 【伺服器資料恢復】同友儲存raid5崩潰的資料恢復案例伺服器資料恢復AI
- 某品牌儲存raid崩潰解決方案/raid5資料恢復案例AI資料恢復
- EMC 儲存資料恢復案例詳解【資料恢復方案】資料恢復
- 【儲存資料恢復】IBM DS5300儲存由於硬碟壞道導致RAID5崩潰的資料恢復案例資料恢復IBM硬碟AI
- 【伺服器資料恢復】raid5硬碟離線導致EVA儲存崩潰資料恢復案例伺服器資料恢復AI硬碟
- 【儲存資料恢復】NetApp儲存誤刪除的資料恢復案例資料恢復APP
- 【儲存資料恢復】NetApp儲存誤刪資料夾的資料恢復案例資料恢復APP
- 【VSAN資料恢復】VSAN儲存資料恢復案例資料恢復
- 【儲存資料恢復】EqualLogic PS系列儲存磁碟故障的資料恢復案例資料恢復
- 【伺服器資料恢復】某品牌伺服器儲存raid5資料恢復案例伺服器資料恢復AI
- 【伺服器資料恢復】EMC Unity儲存誤刪除的資料恢復案例伺服器資料恢復Unity
- 【伺服器資料恢復】EMC Isilon儲存誤刪除的資料恢復案例伺服器資料恢復
- 【伺服器資料恢復】EMC某型號伺服器raid5資料恢復案例伺服器資料恢復AI
- 【伺服器儲存資料恢復】HP-Lefthand儲存資料恢復案例伺服器資料恢復
- 【儲存資料恢復】某品牌EqualLogic系列儲存介紹和資料恢復方法資料恢復
- 【儲存資料恢復】HP EVA儲存誤刪除VDISK的資料恢復案例資料恢復
- 【伺服器資料恢復】Storwize系列儲存raid5資料恢復案例伺服器資料恢復AI
- 【伺服器資料恢復】某品牌MSA SAN儲存資料恢復案例伺服器資料恢復
- 【伺服器資料恢復】某醫院儲存伺服器RAID5資料恢復案例伺服器資料恢復AI
- 【伺服器資料恢復】同友儲存raid5崩潰後上層虛擬機器資料恢復案例伺服器資料恢復AI虛擬機
- 伺服器資料恢復—EMC儲存zfs檔案系統下raid5故障的資料恢復案例伺服器資料恢復AI
- Vsan資料恢復—Vsan分散式儲存資料恢復案例資料恢復分散式
- 【儲存資料恢復】esx vmfs的互斥導致儲存資料丟失的資料恢復案例資料恢復
- 【北亞伺服器資料恢復】raid5崩潰導致同友儲存無法啟動的資料恢復案例伺服器資料恢復AI
- 【伺服器儲存裝置資料恢復】EMC儲存裝置POOL上的資料卷被刪除的資料恢復案例伺服器資料恢復
- 【儲存資料恢復】IBM儲存檔案NTFS系統損壞的資料恢復案例資料恢復IBM
- VSAN儲存結構解析+儲存資料恢復案例資料恢復
- 【伺服器資料恢復】DroboPro FS網路儲存raid5資料恢復案例伺服器資料恢復AI
- 伺服器資料恢復—EVA儲存raid5硬碟離線的資料恢復案例伺服器資料恢復AI硬碟
- 【伺服器資料恢復】HP EVA儲存資料恢復案例伺服器資料恢復
- 伺服器資料恢復—IBM儲存raid5陣列崩潰後的OCFS2檔案系統資料恢復案例伺服器資料恢復IBMAI陣列
- 【伺服器資料恢復】EMC伺服器Isilon儲存誤刪除的資料恢復案例伺服器資料恢復