伺服器資料恢復成功案例+伺服器資料恢復原理

北亞資料恢復發表於2018-07-18

伺服器資料恢復案例一:

某研究院 DELL伺服器 磁碟陣列崩潰,內建15塊1TB硬碟搭建的RAID5陣列。一開始有一塊硬碟離線,在更換新硬碟進行同步的過程中,第二塊磁碟指示燈報警,同步失敗,陣列無法正常工作。
伺服器資料恢復檢測:
最先離線的硬碟訪問速度極其緩慢,第二塊離線的磁碟有少量壞扇區,其他磁碟無明顯物理問題。
伺服器質邏輯狀況:
整個陣列只包含一個卷組,該卷組佔用陣列全部空間;並且該卷組只有一個起始位置為0扇區的XFS裸分割槽。
制定伺服器資料恢復方案:
RAID5陣列架構在設計上只支援一塊磁碟的錯誤冗餘功能,當第二塊磁碟離線後陣列便無法正常工作。根據使用者描述可知,整個陣列的崩潰主要由第二塊磁碟造成。所以第二塊磁碟的處理是此次恢復的關鍵
伺服器資料恢復過程:
1、對所有硬碟做只讀映象的備份,單獨備份第二塊離線的硬碟,備份過程中略過壞扇區。
2、對15塊硬碟映象檔案進行異或測試,全部透過,無明顯錯誤。
3、計算第二塊硬碟損壞扇區位置的資料,並將其寫入映象檔案。
4、在備份過程中同時分析原RAID組成結構,構建虛擬RAID環境。
5、驗證RAID結構是否正確。
6、將第二塊磁碟的映象備份到新硬碟,並將其強制上線,更換第一塊磁碟,並對其進行同步。(注意:在操作之前要對所有硬碟進行備份)
7、複製資料。
伺服器資料恢復結論:
因為異或測試完全透過,所以表明該儲存發生故障後沒有新資料寫入,或結構改動。
所以可以根據其他幾塊好硬碟計算出壞硬碟對應位置的資料。
恢復完成後,目錄結構完整,重要文件全部完好。FSCK無任何錯誤提示,客戶認可所恢復的資料,恢復成功。

伺服器資料恢復案例二:

某公司的P4500伺服器raid故障,強制上線操作後raid依然不可用,該使用者儲存中共三組raid,兩個卷,12塊物理硬碟。具體情況如下:

伺服器資料恢復第一步:檢測物理硬碟,硬碟無故障,隨後對伺服器中所有磁碟進行全盤映象並對映象檔案進行分析。底層的RAID是一個HP雙迴圈RAID5,第一組RAID正常。第二組RAID也是RAID5,所以可以肯定第二組RAID中掉盤數量至少為2塊。
伺服器資料恢復第二步:使用窮舉加校驗的方法分析最早掉線的磁碟後踢出,重組raid。
最後將生成的資料和第一組完好的RAID一同掛載到HP-P4500伺服器上。然後啟動伺服器,上層卷可用,檢查最新檔案正常,資料恢復成功。

伺服器資料恢復案例總結:

由於技術的不斷進步,不同型號的伺服器出現RAID 5故障後,處理方法也不同。
現在大型應用程式的網路拓樸結構,一般都採用C/S結構或B/S結構,至少需要一臺裝有大型資料庫的伺服器安放於中心機房。基於對伺服器安全性與可靠性的考慮,通常會對伺服器的磁碟採用磁碟陣列RAID(Redundant Array of Inexpensive Disk)進行磁碟冗餘備份。其中RAID 5陣列級別為無獨立校驗磁碟的奇偶校驗磁碟陣列,採用資料分塊和獨立存取技術,能在同一磁碟上並行處理多個訪問請求,同時允許陣列中的任何一個硬碟出現故障。
實際應用中,由於某些不可避免的客觀原因,可能會造成一些陣列故障。最常出現的狀況就是硬碟自行離線,聯機狀態顯示為DDD(Defunct Disk Drive,無效磁碟驅動器),硬碟出現物理故障或邏輯故障。如果是物理故障,只有進行硬碟更換;如果是邏輯故障,可以透過有針對性的技術修復,恢復硬碟的線上狀態,繼續保持其原始陣列中的硬碟資料條帶化分佈狀態,延續資料儲存體系的一致性。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2158064/,如需轉載,請註明出處,否則將追究法律責任。

相關文章