【伺服器資料恢復】戴爾某型號伺服器raid故障的資料恢復案例

北亞資料恢復發表於2022-07-06

伺服器故障:


戴爾某型號伺服器由於raid損壞而崩潰,由於伺服器資料涉密,管理員聯絡我們資料恢復中心上門進行資料恢復。



伺服器故障檢測:


資料恢復工程師攜帶相關裝置到現場對伺服器進行檢測,發現導致伺服器崩潰的原因是raid陣列中某些硬碟掉線。硬體工程師

對所有磁碟進行物理檢測後沒有發現物理故障和壞道。隨後資料恢復工程師藉助資料恢復軟體將故障伺服器中的所有磁碟映象

到準備好的資料恢復服務平臺上。



伺服器資料恢復過程:


1、分析故障伺服器RAID結構。


該故障伺服器的LUN全部基於RAID陣列組,所以要恢復伺服器資料首先要分析伺服器底層RAID資訊,然後根據分析獲取到的

資訊重構原始的RAID組。伺服器資料恢復工程師對raid陣列進行分析後發現伺服器中有兩塊硬碟離線。由於6號盤和10號盤都

屬於Hot Spare,但在伺服器發生故障時6號Hot Spare替換了掉線的5號硬碟,可10號盤由於未知原因未啟用。伺服器雖然成

功啟用了6號盤Hot Spare,但RAID中仍缺失一塊硬碟,資料沒有成功同步到6號硬碟。伺服器資料恢復工程師繼續分析其他

硬碟,獲取資料在硬碟中的分佈規律,RAID條帶的大小,每塊磁碟的順序等資訊。


2、重組raid分析掉線盤順序。


根據獲取到的raid資訊,資料恢復工程師使用北亞自主開發的RAID虛擬程式虛擬重組故障伺服器raid。重組完成後分析伺服器

中兩塊掉線硬碟的掉線順序。透過排查,伺服器資料恢復工程師發現有一塊硬碟在同一個條帶上的資料和其他硬碟明顯不一致

,初步判斷此硬碟可能是最先掉線的。透過北亞自主開發的RAID校驗程式對這個條帶做校驗,最終確定最先掉線的硬碟。


3、分析RAID組中的LUN資訊。


基於獲取到的raid資訊,掉盤順序,根據分析結果重組raid。分析LUN在RAID組中的分配資訊和LUN分配的資料塊MAP。然後

根據這些資訊使用北亞自主開發的raid資料恢復程式,解釋LUN的資料MAP並匯出LUN的所有資料。


4、解釋ZFS檔案系統並修復。


使用北亞自主開發的ZFS檔案系統解釋程式對生成的LUN做檔案系統解釋,解析所有檔案節點及目錄結構。



伺服器資料恢復結果:


由伺服器管理員親自對資料進行驗證,一切資料正常、完整,本次資料恢復成功。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2904451/,如需轉載,請註明出處,否則將追究法律責任。

相關文章