你做了什麼自己沒數嗎?現在這個樣子我們也沒辦法—陣列故障操作不當導致無法恢復資料
[伺服器raid5磁碟陣列情況簡介]
西藏某政府機構使用的一臺MS SQL SERVER伺服器,是由4塊硬碟組成的raid5磁碟陣列,劃分一個邏輯卷,單盤為73GSCSI硬碟,組建於一臺IBM X225型號伺服器上。作業系統為WINDOWS 2003。
[伺服器磁碟陣列故障經過]
A、伺服器在正常使用中raid忽然癱瘓,檢查伺服器發現已經有有3塊硬碟為離線狀態。
B、管理員採用了隨便選擇2塊硬碟進行強制上線操作,但是作業系統無法啟動。
C、使用WINPE光碟啟動作業系統後,可以看到資料。
D、把備份好的資料庫檔案使用zip檔案格式複製到行動硬碟上,在其他伺服器機器上測試後發現備份檔案無法正確解壓但檔案大小、名稱都正確。
E、聘請第三方維保公司對伺服器進行更換raid卡操作並且重建一組raid5陣列。
F、管理員在raid上重灌系統後正常工作,同時試圖修復zip檔案中的資料庫,經過一天的時間依然沒有成功。
[伺服器磁碟陣列資料恢復結論]
這個案例的結果完全不同於我以前分享的伺服器資料恢復案例,因為資料遭到了嚴重破壞,無法按照客戶的要求進行資料恢復。
[raid5 資料恢復失敗的原因分析和raid5資料恢復建議]
A,伺服器在使用RAID5陣列進行儲存時一定要及時對raid進行維護,保證raid正常,一旦發現有一塊硬碟離線後即使伺服器可以執行但一定要及時備份資料,並且對出現故障的磁碟陣列進行rebuild操作。等到伺服器癱瘓後才對raid磁碟陣列進行檢查已經是事後補救了,資料恢復的難度也相應增大。
B,如果由於運維工作不及時或其他原因導致raid5陣列2塊以上硬碟離線,切記不可隨意選擇硬碟上線,如果在選錯盤的情況下啟動系統將有可能導致raid狀態改變,破壞磁碟陣列中的重要資料,導致資料恢復失敗。具體應對方法可以參考張宇工程師的《RAID損壞後,我們該如何緊急應對?》這篇文章。
C,只要目錄區正常或者部分正常,就可以使用PE看到目錄,但這並不意味著資料區一定正常,其實在第二步中系統無法啟動就是因為強勢上線的操作是錯誤的,此時應該停止繼續操作。而管理員在PE裡讀到目錄,實際上已經對檔案系統進行了載入,破壞了正常檔案系統的後設資料區(只是有可能破壞的不影響要恢復的資料)。
D,ZIP檔案無法解壓的原因是RAID結構錯誤。管理員透過強制上線操作上線了2塊硬碟,此時共有3塊硬碟線上,但是這3塊硬碟中有一塊是先離線的磁碟,這就導致了最新資料與先離線盤中的舊資料混合在一起。此時目錄正確但資料區是混亂的,如果不對這3塊硬碟進行全面的資料同步的話基本上市可以完整恢復資料的。
E,如果自己無法解決raid5陣列出現的故障需要聘請維保公司進行解決時要注意合同中確定有資料恢復的專案,可以讓其代為進行資料恢復處理(但最好還是諮詢幾家專業的資料恢復公司,確定一下資料恢復方案)。如果維保公司沒有資料恢復的服務範圍,那麼最好優先或者直接選擇資料恢復公司。因為大多數情況維保公司沒有資料恢復服務無法進行資料恢復只好再找資料恢復公司,這其中的轉折不僅對資料的安全、流程規範等方面無法直接掌控,增加資料恢復難度、降低資料恢復成功率,而且導致費用增加(有時候大得可怕)。
F,導致本案例中數無法恢復的最致命操作就是重建RAID5。IBM X225使用SERVER RAID SUPPORT CD重建RAID時,預設會對所有資料進行清0。其它型號的伺服器通常也會在重建raid時重新同步校驗,打亂原有資料結構,不過完整同步的過程需要一定的時間,如果在同步沒有完成的情況下中斷同步還是可以對未同步的剩餘資料進行資料恢復。
G,管理員進行了一天的同步,73G的RAID成員盤都已經同步完成了。資料已經完全毀了。
西藏某政府機構使用的一臺MS SQL SERVER伺服器,是由4塊硬碟組成的raid5磁碟陣列,劃分一個邏輯卷,單盤為73GSCSI硬碟,組建於一臺IBM X225型號伺服器上。作業系統為WINDOWS 2003。
[伺服器磁碟陣列故障經過]
A、伺服器在正常使用中raid忽然癱瘓,檢查伺服器發現已經有有3塊硬碟為離線狀態。
B、管理員採用了隨便選擇2塊硬碟進行強制上線操作,但是作業系統無法啟動。
C、使用WINPE光碟啟動作業系統後,可以看到資料。
D、把備份好的資料庫檔案使用zip檔案格式複製到行動硬碟上,在其他伺服器機器上測試後發現備份檔案無法正確解壓但檔案大小、名稱都正確。
E、聘請第三方維保公司對伺服器進行更換raid卡操作並且重建一組raid5陣列。
F、管理員在raid上重灌系統後正常工作,同時試圖修復zip檔案中的資料庫,經過一天的時間依然沒有成功。
[伺服器磁碟陣列資料恢復結論]
這個案例的結果完全不同於我以前分享的伺服器資料恢復案例,因為資料遭到了嚴重破壞,無法按照客戶的要求進行資料恢復。
[raid5 資料恢復失敗的原因分析和raid5資料恢復建議]
A,伺服器在使用RAID5陣列進行儲存時一定要及時對raid進行維護,保證raid正常,一旦發現有一塊硬碟離線後即使伺服器可以執行但一定要及時備份資料,並且對出現故障的磁碟陣列進行rebuild操作。等到伺服器癱瘓後才對raid磁碟陣列進行檢查已經是事後補救了,資料恢復的難度也相應增大。
B,如果由於運維工作不及時或其他原因導致raid5陣列2塊以上硬碟離線,切記不可隨意選擇硬碟上線,如果在選錯盤的情況下啟動系統將有可能導致raid狀態改變,破壞磁碟陣列中的重要資料,導致資料恢復失敗。具體應對方法可以參考張宇工程師的《RAID損壞後,我們該如何緊急應對?》這篇文章。
C,只要目錄區正常或者部分正常,就可以使用PE看到目錄,但這並不意味著資料區一定正常,其實在第二步中系統無法啟動就是因為強勢上線的操作是錯誤的,此時應該停止繼續操作。而管理員在PE裡讀到目錄,實際上已經對檔案系統進行了載入,破壞了正常檔案系統的後設資料區(只是有可能破壞的不影響要恢復的資料)。
D,ZIP檔案無法解壓的原因是RAID結構錯誤。管理員透過強制上線操作上線了2塊硬碟,此時共有3塊硬碟線上,但是這3塊硬碟中有一塊是先離線的磁碟,這就導致了最新資料與先離線盤中的舊資料混合在一起。此時目錄正確但資料區是混亂的,如果不對這3塊硬碟進行全面的資料同步的話基本上市可以完整恢復資料的。
E,如果自己無法解決raid5陣列出現的故障需要聘請維保公司進行解決時要注意合同中確定有資料恢復的專案,可以讓其代為進行資料恢復處理(但最好還是諮詢幾家專業的資料恢復公司,確定一下資料恢復方案)。如果維保公司沒有資料恢復的服務範圍,那麼最好優先或者直接選擇資料恢復公司。因為大多數情況維保公司沒有資料恢復服務無法進行資料恢復只好再找資料恢復公司,這其中的轉折不僅對資料的安全、流程規範等方面無法直接掌控,增加資料恢復難度、降低資料恢復成功率,而且導致費用增加(有時候大得可怕)。
F,導致本案例中數無法恢復的最致命操作就是重建RAID5。IBM X225使用SERVER RAID SUPPORT CD重建RAID時,預設會對所有資料進行清0。其它型號的伺服器通常也會在重建raid時重新同步校驗,打亂原有資料結構,不過完整同步的過程需要一定的時間,如果在同步沒有完成的情況下中斷同步還是可以對未同步的剩餘資料進行資料恢復。
G,管理員進行了一天的同步,73G的RAID成員盤都已經同步完成了。資料已經完全毀了。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2151642/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【故障恢復】因spfile修改錯誤導致資料庫無法啟動的恢復方法資料庫
- 【伺服器資料恢復】RAID故障導致資料庫分割槽無法識別的資料恢復伺服器資料恢復AI資料庫
- 伺服器資料恢復—nas儲存硬碟出現故障離線導致無法訪問的資料恢復案例伺服器資料恢復硬碟
- 【伺服器資料恢復】VSAN故障導致虛擬機器無法訪問的資料恢復案例伺服器資料恢復虛擬機
- 【伺服器資料恢復】raid5故障導致儲存的卷無法掛載的資料恢復伺服器資料恢復AI
- 【北亞資料恢復】非物理故障導致的伺服器藍屏且無法重啟的資料恢復案例資料恢復伺服器
- 【伺服器資料恢復】IBM儲存raid5故障導致卷無法掛載的資料恢復伺服器資料恢復IBMAI
- SQL:我為什麼慢你心裡沒數嗎?SQL
- nas儲存伺服器硬碟故障離線導致的磁碟陣列失效、伺服器無法訪問的資料恢復案例伺服器硬碟陣列資料恢復
- 【伺服器資料恢復】nas儲存伺服器硬碟故障離線導致無法訪問的資料恢復案例伺服器資料恢復硬碟
- 伺服器意外斷電導致無法重啟資料恢復伺服器資料恢復
- 在大資料時代,我們真的沒有隱私嗎?大資料
- 資料庫恢復狀態可能導致JOB無法自動執行資料庫
- “你把這個遊戲停掉,就什麼事也沒有了”遊戲
- 磁碟IO故障導致的SQLServer資料庫無法寫入SQLServer資料庫
- 美國區所有資料被刪除且無法恢復,這個操作有點狠......
- 【北亞資料恢復】IBM DS系列儲存伺服器熱備盤同步資料故障導致卷無法掛載的資料恢復資料恢復IBM伺服器
- [提問交流]為什麼我自己在資料庫新增的欄位,在後臺都無法進行操作資料庫
- 【恢復】非歸檔模式下因誤刪除資料檔案導致資料庫無法OPEN的故障處理模式資料庫
- 【伺服器資料恢復】異常斷電導致ESXI無法連線儲存的資料恢復案例伺服器資料恢復
- 【伺服器資料恢復】斷電導致伺服器無法進入系統的資料恢復案例伺服器資料恢復
- win10沒有恢復選項怎麼辦 win10開機無法進入恢復模式怎麼解決Win10模式
- memory_target設定不當導致資料庫無法啟動的問題資料庫
- NAMES.DIRECTORY_PATH配置不當導致無法連線oracleOracle
- spfile誤修改導致資料庫無法啟動的另一種恢復方法資料庫
- 伺服器資料恢復-raid5多塊磁碟離線,熱備盤沒有啟用導致陣列崩潰的資料恢復案例伺服器資料恢復AI陣列
- 【伺服器資料恢復】Raid5癱瘓導致上層lun無法使用的資料恢復案例伺服器資料恢復AI
- 沒辦法,我必須幹掉他們團隊的 Leader
- 學完了這篇JVM,面試官真拿我沒辦法了!JVM面試
- 【伺服器資料恢復】重灌系統導致XFS檔案系統分割槽無法訪問的資料恢復伺服器資料恢復
- 【虛擬機器資料恢復】異常斷電導致虛擬機器無法啟動的資料恢復案例虛擬機資料恢復
- 恢復資料庫引數錯誤無法啟動資料庫
- 電腦沒聲音了怎麼辦恢復正常 電腦沒聲音了恢復正常的操作方法
- 京東員工試用期被優化,領導:你很好,是我不好,沒辦法留住你優化
- 【伺服器資料恢復】斷電導致raid資訊丟失的磁碟陣列資料恢復案例伺服器資料恢復AI陣列
- 【北亞資料恢復】異常斷電導致linux伺服器無法啟動,資料庫損壞的資料恢復資料恢復Linux伺服器資料庫
- 伺服器資料恢復-VSAN節點掉線導致虛擬機器無法訪問的資料恢復方案伺服器資料恢復虛擬機
- 【北亞伺服器資料恢復】異常斷電導致ESXI系統無法連線儲存的資料恢復伺服器資料恢復