伺服器資料恢復案例之RAID資訊丟失資料恢復

北亞資料恢復發表於2019-09-19

【資料恢復故障描述】

今天為大家介紹的是伺服器資料恢復案例,伺服器的故障是raid資訊丟失了。下面簡單介紹一下本次資料恢復的伺服器基礎資訊:某品牌DL380系列伺服器,儲存是由6塊73GB SAS硬碟組成的RAID5磁碟陣列,伺服器上層作業系統是WINDOWS 2003 SERVER,伺服器內主要儲存了企業的內部檔案,沒有資料庫檔案,在伺服器的主機(無UPS)發生故障前曾經出現過幾次意外斷電的情況,由於重啟後並沒有出現異常,因此伺服器一直在使用,直到有一次斷電重啟後RAID報錯,提示無法找到儲存裝置,進入RAID管理模組後操作當機,管理員多次嘗試重啟伺服器後還是沒有辦法進入系統,為了防止伺服器內資料丟失,管理員聯絡到資料恢復中心進行伺服器資料恢復。

【資料恢復故障分析】

通常伺服器出現這種情況的資料丟失多因為伺服器意外斷電導致RAID模組損壞(包括RAID管理資訊丟失和RAID模組硬體損壞)。一般在RAID陣列建立完成後陣列的管理模組資訊就固定下來不會再發生改變,但是raid陣列的模組資訊依然屬於可修改部分,伺服器意外斷電很容易造成這部分資訊被篡改甚至丟失,多次斷電甚至有可能導致RAID卡上的元器件損壞,從而使主機失去對多塊物理硬碟進行RAID管理的中間層模組。該案例中對RAID模組的操作當機現象極有可能是由RAID卡硬體損壞引起的(後經HP售後技術人員驗證得到證實),此時透過正常途徑已無法將獲取6塊硬碟中的資料,只能依靠第三方提供資料恢復服務來解決。

【伺服器資料恢復過程】

  1. 伺服器資料恢復第一步首先對客戶的伺服器內所有硬碟進行嚴格的物理檢測,用以排查硬碟是否有硬體故障。經過檢查發現伺服器內的所有硬碟均可以正常讀取。

  2. 由於硬碟全部正常,因此不需要進行硬體修復,直接對伺服器內的硬碟進行映象備份即可。

  3. 映象完成後,伺服器資料恢復工程師開始對這組raid進行結構分析,主要是為了確定raid陣列的硬碟順序、資料塊的大小和陣列校驗方式等用於重新構建raid陣列。

  4. 伺服器資料恢復工程師利用分析出來的raid陣列資訊重新虛擬重建一組raid陣列並進行邏輯校驗,確保重構RAID所應用的各引數正確無誤後,針對使用者最為關注的資料進行完全驗證;

  5. 最後,資料恢復工程師聯絡客戶對恢復出來的資料進行驗證,經過驗證後所有資料均已經成功恢復,資料遷移成功後本次資料恢復圓滿結束。

【伺服器儲存安全建議】

  1. 儘量保證機房電源供應穩定,以減少電源異常對主機及儲存的衝擊;

  2. 最好為重要的伺服器及儲存配置UPS,可在機房意外斷電的情況下保證核心業務系統能繼續維持一定時間的正常工作,從而為企業尋求應急解決方案贏得寶貴的時間;

  3. 對於服務年限已久的伺服器應定期進行安全狀況檢查,並對其整體執行狀態進行評估以決定是否進行硬體及系統的全面升級,同時提前制定突發資料災難的緊急處理方案,以降低資料災難帶來的業務損失。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2657527/,如需轉載,請註明出處,否則將追究法律責任。

相關文章