【伺服器資料恢復】HP EVA虛擬化磁碟陣列常見故障和資料恢復方案

北亞資料恢復發表於2024-02-07

EVA儲存結構&原理:

EVA是虛擬化儲存,在工作過程中,EVA儲存中的資料會不斷地遷移,再加上執行在EVA上的應用都比較繁重,磁碟負載高,很容易出現故障。EVA是透過大量磁碟的冗餘空間和故障後rss冗餘磁碟動態遷移保護資料。但是如果磁碟掉線數量到達一個臨界點,EVA儲存就會崩潰。

EVA儲存內部的結構組成不同於普通的基於RAID的儲存,內部稱之為VRAID。

EVA對每個物理磁碟(PV)進行簽名(寫在每個磁碟的0扇區),簽名後將物理磁碟分配到不同的DISK GROUP。在DISK GROUP中,每個PV會按一定大小劃分為若干儲存單元(PP),PP的大小為2的整數次冪,大小在2-16M之間。

每個PV中有一定數量的PP,這些PP一起形成整個DISK GROUP的可用空間。

所有的PV按照5-15的數量組成若干組RSS,每組RSS就是一個冗餘組,但RSS不等同於常規RAID。常規RAID是基於磁碟的RAID演算法,而RSS是基於PP的RAID演算法。

為提高效能,EVA儲存會有傾向地輪流分配不同的RSS組,這些RSS之間的資料儲存是基於JBOD的,每個RSS組成的stripe的成員是不同PV中不同位置的PP。

無論RSS中成員數量有多少個,對於VRAID5,一個stripe中的PV數總是5個;對於VRAID6,一個stripe中的PV數總是6個。

當一個RSS中某個PV離線,控制器會從同一個RSS組中其他磁碟中尋找可用的PP,在邏輯上實現每個stripe的rebuild,從而保證整個儲存的安全性。

當一個RSS中損壞的磁碟數量少於等於6個的時候,EVA會合並此RSS到另一個RSS中,這樣可用的冗餘空間就是共享的了,空間就可以從另一個較安全的RSS中遷移過來。

為了保證有足夠的空間提供冗餘保護,在建立DISK GROUP時,EVA會提供一個Protection Level的保護級別:single表示用2個磁碟的空間做冗餘,double表示用4個磁碟的空間做冗餘,但這個冗餘不同於hotspare,這個冗餘空間僅會預留到每個PV的尾部。


EVA儲存常見故障:

1、RSS中多個磁碟掉線,超過冗餘保護級別。

2、加入新磁碟遷移資料時,新磁碟存在物理故障。

3、刪除VDISK或EVA初始化。

4、主機與儲存無法連線。


EVA儲存資料恢復原理:

EVA儲存核心結構部分來自於所有vdisk的運算pp map表,這個pp map表會因為磁碟的不斷遷移而遷移,所有故障均可透過此map表恢復。

如果pp map表不存在,根據不同的條帶之間的冗餘關係,可透過最佳化演算法對所有PP進行條帶性集合,形成若干組正確的條帶資料,然後基於檔案系統結構、資料結構等特徵重組若干條帶。


EVA儲存資料恢復方案:

1、將EVA主機一端的連線拔出,直接接到主機hba卡上,認出所有物理硬碟。將磁碟以只讀方式做完整映象(eva主機與擴充套件櫃之間多是銅線連線,可能需要在擴充套件櫃上增加光纖收發模組,再透過光鏈路接到hba卡上。也可以將所有硬碟拆下來放入其他光纖通道櫃中進行映象)。

使用EVA擴充套件櫃進行映象:

2、透過北亞企安自主研發的frombyte recovery for hp eva程式重組vdisk,直接寫入成映象檔案或目標物理磁碟。

3、解釋映象檔案或目標磁碟,然後遷移映象或匯出內部檔案。

來自 “ ITPUB部落格 ” ,連結:https://blog.itpub.net/31380569/viewspace-3006538/,如需轉載,請註明出處,否則將追究法律責任。

相關文章