伺服器資料恢復—OceanStor儲存raid5熱備盤同步資料失敗的資料恢復案例

北亞資料恢復發表於2024-01-18

伺服器資料恢復環境:

華為OceanStor某型號儲存,儲存內有一組由24塊硬碟組建的raid5陣列,配置1塊熱備盤。


伺服器故障:

該儲存raid5陣列中有一塊硬碟離線,熱備盤自動啟用並開始同步資料,在熱備盤同步資料的過程中,raid5陣列中另一塊硬碟離線,上層應用崩潰,資料丟失。


伺服器資料恢復過程:

1、將該儲存中所有硬碟編號後取出,硬體工程師對所有硬碟進行硬體故障檢測,經過檢測發現raid5中只有1塊硬碟存在硬體故障,其他硬碟可正常讀取。將完好硬碟以只讀方式進行全盤映象,映象完成後按照編號將所有磁碟還原到原儲存中,後續的資料分析和資料恢復操作都基於映象檔案進行,避免對原始磁碟資料造成二次破壞。

由於本案例所使用的raid控制器對磁碟檢測策略比較嚴格,通常會將無物理故障但效能不穩定的硬碟識別為壞盤並踢出raid陣列。之前硬體工程師只檢測到一塊硬碟有物理故障,另外一塊掉線盤應該是因為讀寫不穩定被踢出陣列掉線。

2.、基於映象檔案分析每塊硬碟的底層資料,獲取到條帶大小、資料走向、盤序、熱備盤、資料庫的分佈規律等raid相關資訊。根據獲取到的raid5相關資訊虛擬重組raid5陣列。

3、在重組raid5陣列的過程中發現有一塊硬碟在相同條帶上的資料與其他硬碟的明顯不同,該硬碟進行條帶校驗後確認該硬碟被同步破壞。

4、重組raid5陣列後,資料恢復工程師分析lun在raid5陣列中的分配情況及資料塊map。將map提取出來後透過北亞企安自研資料恢復程式解析&恢復lun資料。

5、北亞企安資料恢復工程師編寫檔案系統解析程式對虛擬重組出來的raid5陣列中的檔案系統進行解析,匯出資料庫檔案後交由資料庫工程師進行校驗和修復。

6、資料庫工程師對資料庫檔案進行驗證後發現部分資料庫檔案和日誌檔案異常,表空間記憶體在大量壞塊,所有控制檔案被破壞,undotbs02丟失。資料庫工程師對資料庫檔案進行修復。

資料庫檔案修復過程:

7、經過資料庫工程師對資料庫檔案的修復和驗證,終於成功恢復資料庫資料。資料恢復工程師將修復好的資料庫資料匯入準備好的環境中進行驗證,經過驗證所有資料均正常。使用者方工程師對資料進行驗證也沒有發現異常。本次伺服器資料恢復工作完成。


來自 “ ITPUB部落格 ” ,連結:https://blog.itpub.net/31380569/viewspace-3004306/,如需轉載,請註明出處,否則將追究法律責任。

相關文章