【伺服器儲存資料恢復】華為OceanStor某型號儲存raid5資料恢復案例

北亞資料恢復發表於2022-07-29

伺服器儲存raid資料恢復環境:

華為OceanStor某型號儲存,16塊FC硬碟(包含一塊熱備盤)組成RAID5。


伺服器儲存raid故障:

該儲存RAID5中的一塊硬碟由於未知原因離線,熱備盤上線同步資料,同步完成一半左右時另外一塊硬碟未知原因離線,

資料同步失敗,raid5崩潰,上層的lun失效。管理員聯絡我們資料恢復中心對該儲存中的raid5進行資料恢復。



伺服器儲存raid資料恢復過程:

1、檢測raid5中所有磁碟:

北亞硬體工程師首先對故障raid中所有磁碟進行物理故障檢測,檢測結果為第一塊掉線硬碟存在物理故障,其他的包括後面

掉線的硬碟均無物理故障。


2、備份raid5中所有磁碟:

將raid5中所有磁碟都映象備份,後續的資料恢復操作都在映象檔案中進行,避免可能對原始資料造成的二次破壞。


3、分析raid5結構:

資料恢復工程師對故障raid中的所有磁碟進行分析,找出熱備盤(熱備盤與其他資料盤有明顯區別)。由於raid是條帶化的

,raid中的資料是按照一定規律儲存,透過分析raid中的資料庫頁在每一個物理磁碟中的分佈情況,北亞資料恢復工程師計

算出raid的磁碟順序、資料走向、條帶大小等基本資訊。


4、找出raid5中被同步的壞盤:

根據分析獲取到的RAID資訊,嘗試透過北亞自主開發的RAID虛擬重組程式將原始RAID虛擬重組出來。故障RAID中掉線兩

塊盤並且有一塊硬碟中的資料由於同步失敗損壞,資料恢復工程師仔細分析每一塊硬碟中的資料,發現有一塊硬碟在同一個

條帶上的資料和其他硬碟明顯不一樣,因此初步判斷此硬碟是被同步損壞的硬碟。透過北亞自主開發的RAID校驗程式對這

個條帶進行校驗,最終確定那塊被同步損壞的硬碟。


5、分析raid中的lun資訊:

分析lun在故障raid中的分配狀態和lun分配的資料塊,然後根據資料MAP匯出LUN的資料。


6、解析EXT3檔案系統:

由於是使用熱備盤虛擬重組的RAID,EXT3檔案系統無法正常掛載,只能提取出oracle資料庫檔案。利用北亞自主開發的文

件系統解析程式對其進行檔案系統解析並匯出oracle資料庫檔案,然後把資料庫檔案移交給資料庫恢復工程師進行校驗和驗

證。


7、修復資料庫,檢測資料檔案完整性:

使用Oracle資料庫檔案檢測工具檢測每個資料庫檔案的完整性但是發現錯誤。於是使用北亞自主研發的Oracle資料庫檢測

工具進行檢測,發現部分資料庫檔案和日誌檔案錯誤, system和sysaux表空間存在許多壞塊,控制檔案全部損壞,

eschoolspace表空間的檔案的壞塊更多,undotbs02丟失;北亞資料庫資料恢復工程師對這些檔案進行手工修復。




北亞資料庫資料恢復工程師建立控制檔案、undo表空間,啟動資料庫到mount。由於system資料檔案存在壞塊,資料庫不

能open,各種隱含引數也不能繞過system的壞塊。搭建資料庫環境並使用dmp檔案還原資料庫,最終匯入10G左右的資料。



資料驗證:

由使用者方配合啟動Oracle資料庫,在本地虛擬機器安裝OA客戶端,透過OA客戶端對資料記錄進行驗證,並且讓使用者安排不同

部門人員進行遠端驗證。驗證透過,資料恢復成功。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2908140/,如需轉載,請註明出處,否則將追究法律責任。

相關文章