伺服器raid5先後兩塊盤掉線的恢復過程
第一部分:資料恢復方案
【故障描述】
某公司的一臺伺服器組了一個raid5磁碟陣列有兩塊磁碟先後掉線,伺服器崩潰。故障伺服器的作業系統為linux redhat 5.3,應用系統為構架於oracle的一個oa,資料重要,時間很急。因oracle已經不再對本oa系統提供後續支援,使用者要求儘可能資料恢復+作業系統復原。
【初檢結論】
熱備盤完全無啟用,硬碟無明顯物理故障,無明顯同步表現。資料通常可恢復
【恢復方案】
1、保護原環境,關閉伺服器,確保在恢復過程中不再開啟伺服器。
2、將故障硬碟標好序號,確保在拿出槽位後可以完全復原。
3、將故障硬碟掛載至只讀環境,對所有故障硬碟做完全映象(參考<如何對磁碟做完整的全盤映象備份>)。備份完成後交回原故障盤,之後的恢復操作直到資料確認無誤前不再涉及原故障盤。
4、對備份盤進行RAID結構分析,得到其原來的RAID級別,條帶規則,條帶大小,校驗方向,META區域等。
5、根據得到的RAID資訊搭建一組虛擬的RAID5環境。
6、進行虛擬磁碟及檔案系統解釋。
7、檢測虛擬結構是否正確,如不正確,重複4-7過程。
8、確定資料無誤後,按使用者要求回遷資料。如果仍然使用原盤,需確定已經完全對原盤做過備份後,重建RAID,再做回遷。回遷作業系統時,可以使用linux livecd或win pe(通常不支援)等進行,也可以在故障伺服器上用另外硬碟安裝一個回遷用的作業系統,再進行扇區級別的回遷。
9、資料移交後,由北亞資料恢復中心延長保管資料3天,以避免可能忽略的紕漏。
【恢復週期】
備份時間,約2小時。解釋及匯出資料時間,約4小時。回遷作業系統,約4小時。
第二部分:資料恢復及系統復原過程
1、對原硬碟進行完整映象,映象後發現2號盤有10-20個壞扇區,其餘磁碟,均無壞道。
2、分析結構:得到的最佳結構為0,1,2,3盤序,缺3號盤,塊大小512扇區,backward parity(Adaptec),結構如下圖:
3、組好後資料驗證,200M以上的最新壓縮包解壓無報錯,確定結構正確。
4、直接按此結構生成虛擬RAID到一塊單硬碟上,開啟檔案系統無明顯報錯。
5、確定備份包安全的情況下,經客戶同意後,對原盤重建RAID,重建時已經用全新硬碟更換損壞的2號盤。將恢復好的單盤用USB方式接入故障伺服器,再用linux SystemRescueCd啟動故障伺服器,之後透過dd命令進行全盤迴寫。
6、回寫後,啟動作業系統。正常情況下,這時候所有工作應該完成了。不巧的是,因幫頗費周折才解決,特意另起一段敘述。
系統復原過程:
dd所有資料後,啟動作業系統,無法進入,報錯資訊為:/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied
懷疑此檔案許可權有問題,用SystemRescueCd重啟後檢查,此檔案時間,許可權,大小均有明顯錯誤,顯然節點損壞。
重新分析重組資料中的根分割槽,定位出錯的/sbin/pidof,發現問題因2號盤壞道引起。
使用0,1,3這3塊盤,針對2號盤的損壞區域進行xor補齊。補齊後重新校驗檔案系統,依然有錯誤,再次檢查inode表,發現2號盤損壞區域有部分節點表現為(圖中的55 55 55部分):
很明顯,雖然節點中描述的uid還正常存在,但屬性,大小,以最初的分配塊全部是錯誤的。按照所有可能進行分析,確定無任何辦法找回此損壞節點。只能希望修復此節點,或複製一個相同的檔案過來。
對所有可能有錯的檔案,均透過日誌確定原節點塊的節點資訊,再做修正。
修正後重新dd根分割槽,執行fsck -fn /dev/sda5,進行檢測,依然有報錯,如下圖:
根據提示,在系統中發現有多個節點共用同樣的資料塊。按此提示進行底層分析,發現,因3號盤早掉線,幫存在節點資訊的新舊交集。
按節點所屬的檔案進行區別,清除錯誤節點後,再次執行fsck -fn /dev/sda5,依然有報錯資訊,但已經很少。根據提示,發現這些節點多位於doc目錄下,不影響系統啟動,於是直接fsck -fy /dev/sda5強行修復。
修復後,重啟系統,成功進入桌面。
啟動資料庫服務,啟動應用軟體,一切正常,無報錯。
到此,資料恢復及系統回遷工作完成。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2213781/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 伺服器資料恢復,raid5兩塊硬碟掉線資料恢復案例伺服器資料恢復AI硬碟
- 儲存raid5陣列兩塊盤掉線的解決過程AI陣列
- IBM伺服器raid5兩塊硬碟離線資料恢復過程IBM伺服器AI硬碟資料恢復
- raid5陣列兩塊硬碟離線資料恢復過程AI陣列硬碟資料恢復
- IBM ds4700 兩塊硬碟掉線資料恢復過程IBM硬碟資料恢復
- 【伺服器raid資料恢復】RAID5兩塊盤離線的資料恢復案例伺服器AI資料恢復
- 【伺服器資料恢復】Raid5陣列兩塊硬碟亮黃燈掉線的資料恢復案例伺服器資料恢復AI陣列硬碟
- 【北亞資料恢復】DELL POWEREDGE 2850伺服器RAID5兩塊硬碟掉線後系統癱瘓的資料恢復資料恢復伺服器AI硬碟
- 【伺服器資料恢復】HP StorageWorks系列儲存RAID5兩塊盤離線的資料恢復伺服器資料恢復AI
- raid5硬碟掉線,重建raid並同步資料後恢復資料過程AI硬碟
- 【伺服器資料恢復】農科院某研究所DELL伺服器raid5兩塊硬碟掉線的資料恢復伺服器資料恢復AI硬碟
- 【伺服器資料恢復】伺服器raid5陣列2塊硬碟掉線的資料恢復案例伺服器資料恢復AI陣列硬碟
- 【伺服器資料恢復】5盤RAID5中4塊盤重建RAID5後恢復原RAID5資料的案例伺服器資料恢復AI
- RAID磁碟陣列掉線3塊的資料恢復過程AI陣列資料恢復
- 儲存有兩塊硬碟離線恢復資料的過程硬碟
- 伺服器重啟後掉線資料恢復伺服器資料恢復
- raid5陣列兩塊硬碟出現物理故障的資料恢復過程AI陣列硬碟資料恢復
- raid5磁碟陣列2塊硬碟離線資料恢復過程AI陣列硬碟資料恢復
- 伺服器資料恢復—raid5成員盤(少一塊盤)新建raid5如何恢復原raid5資料?伺服器資料恢復AI
- 伺服器資料恢復—raid5熱備盤同步資料失敗的資料恢復過程伺服器資料恢復AI
- 【伺服器資料恢復】Raid5熱備盤上線同步時另一塊硬碟離線的資料恢復案例伺服器資料恢復AI硬碟
- 【北亞資料恢復】raid5在熱備盤同步資料過程中,硬碟掉線導致raid崩潰的資料恢復案例資料恢復AI硬碟
- 【伺服器資料恢復】raid5硬碟離線後熱備盤未啟用的資料恢復案例伺服器資料恢復AI硬碟
- raid5硬碟掉線但熱備盤未啟用如何恢復資料AI硬碟
- raid5硬碟同步過程中另一塊硬碟掉線怎麼辦AI硬碟
- V7000儲存兩塊硬碟掉線資料恢復成功案例硬碟資料恢復
- 伺服器掉了兩塊盤,lun丟失的資料恢復方法伺服器資料恢復
- 【北亞伺服器資料恢復】Raid5熱備盤同步資料過程中硬碟離線導致同步失敗的資料恢復伺服器資料恢復AI硬碟
- 銀行伺服器有4塊硬碟掉線資料恢復案例伺服器硬碟資料恢復
- raid5陣列2塊硬碟掉線應該資料恢復還是強制上線AI陣列硬碟資料恢復
- 別太相信陣列的安全性:兩塊硬碟離線資料恢復過程陣列硬碟資料恢復
- raid5硬碟故障資料恢復過程AI硬碟資料恢復
- 【北亞資料恢復】HP P2000伺服器 RAID5硬碟故障掉線的資料恢復資料恢復伺服器AI硬碟
- 【伺服器資料恢復】Dell伺服器raid5磁碟陣列多塊硬碟離線的資料恢復案例伺服器資料恢復AI陣列硬碟
- 伺服器硬碟意外離線的資料恢復過程伺服器硬碟資料恢復
- 【伺服器資料恢復】昆騰儲存raid5多塊硬碟離線的資料恢復案例伺服器資料恢復AI硬碟
- 【伺服器資料恢復】多塊硬碟掉線導致儲存LUN不可用的資料恢復伺服器資料恢復硬碟
- 【伺服器資料恢復】raid5硬碟離線的資料恢復案例伺服器資料恢復AI硬碟