【伺服器資料恢復】RAID5崩潰後強制上線導致資料丟失的資料恢復案例

北亞資料恢復發表於2022-11-23

伺服器資料恢復環境:
某網站伺服器,LINUX作業系統;
6塊硬碟組建RAID5;
邏輯磁碟中只包含一個卷,檔案系統為EXT3,存放所有客戶的數碼照片。

伺服器故障&分析:
網站正常工作中卷突然離線,管理員檢查伺服器發現1號與4號兩塊硬碟指示燈顯示黃色。致電伺服器廠商售後,廠商技術人員提供的解決方案為隨機選擇一塊報警的硬碟強制上線。
管理員選擇4號盤強制上線,上線後可MOUNT,但很多目錄打不開,某些目錄下近幾天的檔案丟失。使用者意識到問題的嚴重性後馬上關機,沒有做其他任何操作,聯絡我們資料恢復中心尋求幫助。
經過資料恢復工程師檢測,發現1號與4號盤並非同時OFFLINE,4號盤先離線,之後1號盤離線從而導致整個RAID崩潰。管理員進行強制上線操作後,因資料不同步出現了目錄打不開或檔案丟失等故障現象。
MOUNT成功系統便會寫入一定量的資料,寫入資料的條帶中的檢驗資訊會重新生成,導致部分檢驗資訊陳舊。這種情況下是無法透過還原RAID結構的方式恢復資料,只能依靠提取資料的方式進行恢復。

伺服器資料恢復過程:
1、  分析原始RAID5的結構(RAID資訊),去掉4號盤,加入1號盤,虛擬搭建RAID。
2、  透過北亞自主研發軟體提取虛擬邏輯卷資料,發現1號盤有不規律的壞道。
3、  利用專業工具將1號盤完整映象,成功讀取90%以上的壞道。
4、  將映象加入到虛擬RAID中再次提取資料。然後將資料輸出到另外準備好的硬碟上。
5、  經過使用者親自檢測,確認恢復99%以上資料。

RAID資料安全Tips:
1、在兩塊以上盤離線的情況下,應該透過查詢日誌等方式確定硬碟離線的先後順序,即使強制上線(儘量少做這類操作),也需要做到風險最小。
2、可以透過增加DRAC或hotspare等方式減少此類事故的發生機率。
3、如果資料重要,出現此類問題後最好先行諮詢專業的資料恢復公司後再進行下一步操作。

相關文章