伺服器資料恢復背景

北京某國企的一臺伺服器在正常執行過程中突然崩潰，該伺服器共有240塊硬碟，其中後設資料儲存使用了24塊硬碟，硬碟搭配情況為9組raid1磁碟陣列和1組raid10磁碟陣列。其餘所有硬碟平均組成了36組raid5磁碟陣列。而到這這一儲存癱瘓的最終原因是其中的一組磁碟陣列中有2塊硬碟先後離線，進而影響到整個伺服器無法使用，只好聯絡北京資料恢復公司進行上門檢測和恢復伺服器資料。

伺服器資料恢復初檢情況

資料恢復中心安排工程師來到客戶現場對故障伺服器進行簡單初檢和評估隨後開始進行資料備份。由於離線硬碟屬於同一組raid陣列，所以對伺服器採取兩種不同的備份方式，即對離線的raid進行全盤扇區級映象，其他未出現離線硬碟的raid陣列進行儲存層面備份即可。在對故障raid陣列的備份過程中發現兩塊掉線的硬碟中有一塊硬碟存在著大量的不規則壞道導致無法進行繼續備份，只好對該硬碟進行韌體更換和修復後繼續備份，但大量的壞道依然存在。

資料分析

伺服器資料恢復工程師首先對故障的RAID陣列底層結構進行詳細分析，然後根據分析出來的raid資訊虛擬重組出raid陣列進行進一步分析。透過進一步分析發現壞道極多的那塊硬碟離線較晚，可能對最終的資料恢復結果產生一定影響。

登入到儲存裝置的管理系統獲取檔案系統中關於卷的基本資訊發現檔案系統中有2個卷，再繼續分析Meta卷的目錄和節點資訊以及Meta捲到Data卷的索引演算法。

伺服器資料恢復

經過伺服器資料恢復工程師的努力分析獲取到了資料恢復必須的基礎資訊後，工程師透過編寫程式進行節點和目錄項掃描解析，匯出檔案系統的完整目錄結構，解析每一個節點中的指標資訊，將這些資訊記錄在資料庫中。

客戶對工程師恢復出的所有資料進行了隨機抽樣檢測後確認資料完整，同意移交資料恢復結果，本次伺服器資料恢復成功。

伺服器癱瘓後的初檢和資料恢復過程

伺服器資料恢復背景

伺服器資料恢復初檢情況

資料分析

伺服器資料恢復

相關文章