raid5硬碟故障資料恢復過程

北亞資料恢復發表於2018-06-13
IBM DS5300全名(IBM System Storage DS5300)是IBM推出的中端儲存系統,它有一個設計合理、功能強大的內部架構,大幅度提升了效能,但某些物理故障或其他操作都可能會對卷或儲存造成破壞,因此對系列儲存的資料恢復技術才有了用武之地。而發生這些故障之後只能找專業的資料恢復公司做資料挽救工作。作者最近就處理過一起IBM DS5300因磁碟故障導致儲存不可用的案例,見下文。

故障描述:
某公安局的一臺IBM DS5300的儲存,一個機頭,連線的4個擴充套件櫃,底層是50塊600GB的硬碟組的RAID。兩組RAID5,其中一組RAID崩潰,這組RAID由27塊600G硬碟組成,存放是Oracle 資料庫檔案,在儲存系統上層一共分了11個卷,卷大小為1TB有10個,一個為4TB。後來因磁碟故障導致儲存不可用,已經過保,聯絡我們做資料恢復。

硬體檢測:
我們的硬體工程師先對客戶的27塊硬碟做了硬體檢測,發現客戶的2塊硬碟出現壞道、SMART的錯誤冗餘級別已經超過閥值,對25塊正常的硬碟進行全盤映象,對2塊有壞道的硬碟用硬體工具進行了恢復並生成映象檔案。

故障分析:
首先收集IBM DS5300儲存日誌資訊。從儲存上硬碟的指示燈看到有兩塊盤亮黃燈,對收集到的日誌資訊進行分析,分析兩塊硬碟的掉線時間,從而知道那塊硬碟裡面的資料是最新,用資料最新的硬碟進行資料恢復。

解決方案:
方案一:透過IBM DS儲存管理軟體進行強制上線,在強制上線之前把儲存的所有硬碟都進行備份,之後進行強制上線。
方案二:透過對硬碟底層資料分析,進行RAID重組,從底層提取資料,重新載入oracle資料庫,除錯上層應用。

實施方案:
已經把儲存的所有硬碟都進行過備份,出現問題也可以進行還原,所以先採用第一種解決方案,先在模擬器上進行測試,之後再儲存上進行上線操作。
透過IBM DS儲存管理軟體進行強制上線,強制上線之後raid處於降級狀態,這個時候設定好熱備盤,讓熱備盤頂上,進行資料同步,同步完之後上層的卷直接可以用了,所有資料也都可見了,上層應用也能正常使用。
節省了很多時間,上層應用也不需要在除錯,可以直接啟動。
 
資料恢復成功:
由於上層的卷直接可以用了,所以資料也都可見了,但是考慮到安全問題,我們還是將卷裡的檔案都複製出來,然後移交給客戶。終於在使用者要求的時間內將資料恢復完成。整個恢復過程一共歷時2天。之所以能這麼快恢復,還是在於我們之前研究過IBM DS5300的儲存原理。知道了IBM DS5300的儲存原理以後,關於它的所有資料災難都可以進行恢復。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2156118/,如需轉載,請註明出處,否則將追究法律責任。

相關文章