解析ESX SERVER故障資料恢復方法

北亞資料恢復發表於2019-07-16

一、故障描述 :基於 ESX SERVER 的常見資料災難

故障表現:

1 、因光纖儲存裝置連線至非 ESX 環境,共享未互斥,對儲存改寫 ( 重灌系統, WINDOWS 初始化,格式化等 ) ,導致儲存結構損壞。

2 、卷升級、變更時分割槽表或 VMFS 卷結構異常。

3 VMFS 儲存中 VMDK 誤刪除。

4 VMFS 格式化。        

二、解決方案

檢測      

1 、檢測是否存在硬體故障,如硬體故障,轉硬體處理

2 、以只讀方式檢測故障表現是否與使用者描述相同

恢復

1 、備份:以只讀方式對故障儲存做完整映象 ( 參考附錄 )

2 、在備份中進行資料分析及恢復操作:按分割槽表結構、 VMFS 結構 ( 節點區、索引區、目錄及資料區 ) 的順序依次分析資料損壞情況,並針對性地做重組恢復。

3 、通常,恢復後的資料會暫存在另一個儲存體上

驗收

對恢復好的資料進行驗證,確認其正確性。如確認,交費 –> 移交原介質及已恢復資料 –> 出具發票 ( 收據 ) 及報告。

如無法認可資料恢復結果,交回原介質,不收服務費,可免費出具報告。

 

三、資料恢復的可能性

針對因非 ESX 伺服器對 VMFS 改寫的情況

這類改寫實際上要考慮對 VMFS 的破壞情況,通常如果僅僅是 WINDOWS 初始化、劃分分割槽或檔案系統格式化 ( 未寫入資料檔案 ) ,資料破壞不嚴重,可恢復。

如果破壞嚴重,典型的,整個 VMFS 的前 100MB 完全覆蓋,資料恢復的難度將非常之大 ---- 這時候,只能透過檔案系統內部關係進行恢復,如果是有結構的資料,如 ORACLE SQL SERVER 資料庫,可以恢復,但像 RAR gz 及多媒體檔案將很難恢復。

 

★  針對卷升級、變更時分割槽表或 VMFS 卷結構異常:

通常此類突發性故障破壞不會很嚴重,通常可完整恢復,但真正嚴格的講是否可恢復,要取決於節點區、索引區、目錄及資料區是否破壞 ( 通常 VMFS 的前 100M 很關鍵 )

 

★  針對 VMDK 誤刪除

VMFS 刪除 VMDK 後,如果沒有新資料寫入,資料依然儲存於 VMFS 中,但儲存本身卻不會再保留指向資料區的索引資訊。這時候,需要對原 VMDK 檔案內部結構進行分析,才可以確定資料恢復的演算法及可靠性。如同 VMFS 破壞嚴重的情況,如果 VMDK 內部儲存的是像資料庫檔案一樣的規則檔案,可恢復性將很高,否則,就需要仔細發現和整理資料恢復的演算法了,有些時候,資料可能無法在有效時間內恢復成功。

 

四、 恢復工時

1TB 以下的 VMFS( 不是要恢復的資料容量 ) ,通常 2 個工作日內可完成; 1TB 以上的隨儲存容量的增加,恢復週期通常也會增加。

 

、故障原因

典型的光纖儲存分配錯誤是遇到最多的 ESX 上的資料故障,因 VMFS CLUSTER 是基於幾臺 ESX SERVER 之間的約定,故而當儲存被非 ESX 系統接管時,便會以獨佔的模式進行管理,這會導致儲存結構的損壞。

   

、如何避免    

做好備份方案,儘可能避免單儲存備份,如資料非常重要,可考慮異地備份。

[ 小貼士 ]

★  針對軟體故障,在資料丟失後,應儘可能減少對儲存的操作,有時候,即使是開著機,什麼都不做,也可能導致災難進一步加劇。條件允許的話,在資料損壞後,最好對磁碟或儲存卷做完整備份

★  針對硬體故障,在裝置無法正常工作後,應儘可能少的加電,以避免裝置的進一步損壞。

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2650644/,如需轉載,請註明出處,否則將追究法律責任。

相關文章