一次資料庫崩潰處理事件
13號早上接到領導通知,說某下屬單位資料庫崩潰,給處理一下。聯絡到相關負責人,瞭解了一些情況,跟同事一步一步的,邊商量,邊互相監督著進行拯救操作,監督不是因為有信任問題,是擔心對方操作過程中有疏漏。畢竟在急救過程中的處理心態跟平時自己做實驗時的悠閒自得的心態是不同的,這一刻真的是鴨梨山大!誰的命令敲錯了,誰的心態不穩了,都可能導致資料庫的狀態往更差的方向發展!
這個專案是找的我處理,領導也是安排給我處理的,但同事小秋秋一直跟我加班加點奮鬥了好多天,很幸運碰到這種能擔當的同伴,他不會打太極,也不會踢皮球,讓人覺得值得信任。
最終資料庫恢復了,不過處理過程中走了很多的彎路,比如控制檔案損壞應該是先從備份集裡恢復控制檔案,而不是通過轉儲重新建立控制檔案。當時由於情況緊急,之前確實沒碰到過這種狀況,處理思路有些混亂,下次碰到資料庫崩潰造成控制檔案和資料檔案損失的情況下,一定首先從備份集裡恢復控制檔案,找到所有以前的備份集,通過備份集恢復控制檔案,找到所有備份集資訊,從備份集裡恢復丟失的資料檔案。
控制檔案損壞以後資料庫打不開,而且rman裡面list backup命令找不到任何的備份集,這時候指定備份集恢復就可以:restore control file from '備份集';
通過這次專案,學到了兩點:
1.認真打好理論基礎。一定分析好故障原因,自習檢查資料庫狀態,儘可能確定資料庫哪些資源可用,哪些資源不可用,具體通過什麼方式用,再去進行處理,寧願處理的慢一些,也不能因為各種緊急的催促盲目的進行沒經過深思熟慮的操作,畢竟生產環境崩潰就跟病人瀕臨死亡的性質是差不多的,大夫不能因為思維錯誤錯手殺死病人。
2.一定要保證心態冷靜,任何操作之前跟同事討論可行性,如果自己單槍匹馬的處理的話,一定深思熟慮之後再動手,寧願讓他 dying 也不能讓他 died !!!
之後自己重新模擬當時的故障場景做了一次模擬故障恢復測試報告。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/20802110/viewspace-1063186/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 儲存崩潰導致資料丟失如何處理
- 聲網崩潰資料的自動化閉環處理
- Android進階;App的異常崩潰處理AndroidAPP
- VC++ 崩潰處理以及列印呼叫堆疊C++
- 資料庫崩潰恢復表結構的方法資料庫
- 一次ORACLE資料庫undo壞塊處理Oracle資料庫
- 「Go框架」gin框架是如何做崩潰處理的?Go框架
- MySQL 5.7 主庫崩潰切備庫MySql
- MySQL 資料庫崩潰(crash)的常見原因和解決辦法MySql資料庫
- 記一次資料庫刪表事件資料庫事件
- 記一次 MySQL 資料庫單表恢復事故處理MySql資料庫
- 記一次Linux核心崩潰:kdump,crash,vmcoreLinux
- win10 360瀏覽器崩潰如何解決_win10開啟360瀏覽器就崩潰處理方法Win10瀏覽器
- WWDC 2018:理解崩潰以及崩潰日誌
- 記一次 .NET 某工控MES程式 崩潰分析
- WIN10 1909瀏覽器總崩潰和卡死如何修復_WIN10 1909瀏覽器老是崩潰卡死處理方法Win10瀏覽器
- 儲存崩潰資料恢復過程;資料恢復案例資料恢復
- 秒殺系統如何保證資料庫不崩潰以及防止商品超賣資料庫
- 事件處理事件
- 伺服器崩潰前的資料拯救實踐伺服器
- 伺服器崩潰硬碟壞道資料恢復伺服器硬碟資料恢復
- 記一次 騰訊會議 的意外崩潰分析
- 記一次VMware的崩潰除錯分析過程除錯
- APP防崩潰APP
- 崩潰日記
- EMC儲存崩潰raid離線恢復資料方法AI
- 惠普塔式伺服器崩潰資料恢復成功案例伺服器資料恢復
- Python資料處理(二):處理 Excel 資料PythonExcel
- 記一次線上崩潰問題的排查過程
- React事件處理React事件
- vue事件處理Vue事件
- JavaSwing 事件處理Java事件
- JavaScript事件處理JavaScript事件
- Flutter | 事件處理Flutter事件
- Android 收集程式崩潰異常資訊Android
- OracleDG資料庫gap處理一列Oracle資料庫
- [python] 基於Tablib庫處理表格資料Python
- 生信公共資料庫下載處理資料庫
- Python 資料處理庫 pandas 入門教程Python