虛擬機器虛擬磁碟丟失的資料恢復成功案例

dbasdk發表於2017-09-07
中石化某省分公司的資訊管理平臺,幾臺VMware虛擬機器——ESX SERVER共享一臺IBM DS4100儲存,大約有40~50組虛擬機器,佔用1.8TB空間,正常工作中,vc裡報告虛擬磁碟丟失,ssh到ESX中執行fdisk -l檢視磁碟,發現storage已經沒有分割槽表了。重啟所有裝置後,ESX SERVER均無法連線到DS4100所在的STORAGE。

我們接到案例後仔細詢問當時的管理員但是可用資訊不多,但是他們無意間提到曾經在這個儲存網路裡連線過一臺windows 2003伺服器,具體情況不詳。於是很自然地想到了,可能是那臺windows 2003因對storage的獨享操作導致了整個vmfs卷損壞。

以整個儲存做分析發現分割槽表清0,有55aa有效結束標誌,有硬碟ID標誌。簡單從前向後檢視,發現一個NTFS卷,但似乎並未寫資料進去,像一個剛剛格式化的卷,對這個NTFS卷的BITMAP做分析,得知大小約為1.8T(全部空間),前部佔用部分空間,3G左右位置佔用部分空間,0.9T附近佔用部分空間,但總佔用空間不超過100M。針對VMFS捲進行分析,發現在原1.8TB的磁碟裡有2組VMFS分割槽,第2組是對第一組的extend,第一組約1.5T,第二組約300GB,因NTFS分割槽並未寫資料到第二個VMFS分割槽裡(最後一個扇區的DBR備份沒有覆蓋有用資料),所以重點在於第一個VMFS分割槽。分析第一組VMFS,卷頭結構丟失,一級索引、二級索引均存在,NTFS覆蓋的資料區正好是某組虛擬機器的臨時記憶體映象,損壞也無妨。


透過以上分析,我們就可以進行資料的恢復了,
第一步:對整個STORAGE進行映象備份。
第二步:分析後,連線兩個VMFS分割槽,直接按照VMFS分析組織方式提取所有VMDK及配置檔案。
第三步:透過nfs直接遷移回ESX SERVER。
另:本例中因已對故障儲存做了安全備份,修復中同時直接重建第一組VMFS卷頭,索引列表、分割槽表等資訊,直接附加在ESX SERVER環境,算是第二個方案。


經過兩天的努力,資料成功恢復,在此感謝工程師們為此付出的努力。
[其他]
1、本例中依然是因為光纖環境互斥不當導致的問題,實際上,應該是這個卷在WINDOWS系統做了重新分割槽,並格式化成了NTFS,之後又對分割槽做了刪除操作。因ESX VMFS的互斥不依賴於硬體,只依賴於作業系統驅動層,所以在其他伺服器接入儲存網路時一定要小心,儘量考慮好儲存分配許可權。
2、ESX因便捷的資訊集中管理,真正使用中往往資料特別重要,一定要做好備份工作,並考慮損壞時遷移的方便性。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29734436/viewspace-2144644/,如需轉載,請註明出處,否則將追究法律責任。

相關文章