[案例分享]華為S5300儲存硬碟掉恢復案例

北亞資料恢復發表於2019-12-10

伺服器資料恢復指的是通過技術手段將原本儲存在伺服器、儲存裝置內的,由於誤操作、硬體故障、惡意攻擊等原因丟失的資料進行修復提取的專業技術。在介紹伺服器資料恢復前我們首先需要了解伺服器的資料結構、檔案儲存原理,今天小編通過一起華為s5300伺服器資料介紹該型號伺服器的資料儲存結構和資料恢復原理。

【伺服器資料恢復故障描述】

今天為大家介紹的案例故障伺服器型號為華為s5300伺服器,需要進行資料恢復的伺服器內一共有24塊硬碟組成一組raid5盤陣,其中一塊硬碟為熱備盤。在伺服器正常執行過程中有一塊硬碟離線啟用了熱備盤進行資料同步,在資料同步的過程中伺服器內另一塊硬碟因為未知故障離線,導致伺服器上層應用崩潰,伺服器內的資料丟失。

【伺服器資料恢復檢測】

接到客戶伺服器內所有硬碟後首先對硬碟進行逐一檢測,發現除1塊硬碟外其他硬碟均不存在物理故障。考慮到客戶原始資料安全性,伺服器資料恢復工程師需要將所有硬碟進行映象備份。

【伺服器資料恢復過程】

  1. 分析伺服器故障原因

    由於華為s5300的控制器檢查磁碟的策略相當嚴格,對於沒有物理故障但效能不穩定的硬碟會當做壞盤踢出raid陣列。伺服器資料恢復工程師檢測到有一塊硬碟存在物理故障,因此該伺服器掉線的兩塊盤其中有一塊是因為讀寫不穩定掉線。

  2.  分析伺服器內raid結構

    針對伺服器硬碟掉線資料恢復案例,想要恢復lun首先需要分析底層的raid結構資訊,根據分析得出的raid陣列資訊重組raid。伺服器資料恢復工程師對每一塊硬碟進行分析,得出了raid陣列的條帶大小、資料走向、硬碟順序、熱備盤、資料庫的分佈規律等基礎資訊。

  3. 通過校驗排查伺服器內被同步硬碟

    根據已經分析得到的伺服器陣列資訊,資料恢復工程師使用自主研發的raid虛擬程式進行重組原始陣列,但是在重組過程中發現有一塊硬碟內的資料被同步破壞,我們在資料恢復過程中需要將被損壞的硬碟排除,資料恢復工程師將所有硬碟進行底層資料結構對比,發現了其中一塊硬碟在相同條帶上的資料與其他硬碟明顯不同,使用raid校驗程式對該硬碟進行條帶校驗後確認該硬碟已被同步破壞。伺服器資料恢復工程師重組raid陣列後分析lun在raid組中的分配情況及資料塊map,只要能夠完整的將map提取,即可藉助資料恢復程式進行解析並恢復lun資料。

  4. 提取伺服器內資料庫檔案並修復資料庫

    伺服器資料恢復工程師自主編寫了檔案系統解析程式對虛擬陣列內的檔案系統進行解析,匯出資料庫檔案後移交資料庫資料恢復工程師進行校驗和修復。

    資料庫工程師對資料庫檔案進行驗證發現部分資料庫檔案及日誌檔案異常。表空間記憶體在大量壞塊、所有控制檔案被破壞,undotbs02丟失,資料庫資料恢復工程師只好對資料庫檔案進行修復,修復過程見下圖:

【伺服器資料恢復結果驗證】

經過資料庫資料恢復工程師對資料的修復和驗證,最終成功恢復伺服器內的資料庫,伺服器資料恢復工程師將修復成功的資料庫資料匯入資料恢復伺服器進行驗證,所有資料正常,聯絡客戶進行現場資料驗證均無異常,本次資料恢復伺服器100%恢復。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2667856/,如需轉載,請註明出處,否則將追究法律責任。

相關文章