RAC資料庫一節點更換HBA卡導致emc儲存裝置序號變動處理記錄
RAC資料庫一節點更換HBA卡導致emc儲存裝置序號變動處理記錄
環境簡介:
作業系統 redhat linux 5.5
資料庫 Oracle RAC 10.2.0.4
儲存 EMC
多路徑 PowerPath
需求:
客戶方一套oracle RAC系統,其中一個節點的機器壞了一個HBA卡,需要更換。
作為資料庫技術人員,我協助配合,和同事一起處理該事情。
實施:
同事之前查閱資料,表示更換同型號的HBA卡,比較簡單,操作步驟為停RAC節點,停機器,換hba卡,啟動機器,啟RAC節點例項相關服務。
和客戶方負責人溝通,申請了中午停機時間一個半小時,本以為足夠了,誰知後來的情況異常曲折。
停節點例項及相關服務,停機,很順利;
問題:
取下壞的HBA卡,換上新的HBA卡,啟動系統,兩塊HBA卡都沒有被識別到
重啟,還是識別不到;
換上壞的HBA卡,啟動機器,原來的都識別不了了;
打電話,查資料,廠商的意見是同型號的HBA卡更換後,需要反覆重啟機器,肯定能識別到;
將信將疑,幾次重啟後,果然識別到了,但是emc儲存裝置序號好多都變了,節點例項起不來,實際上是crs起不來,報錯CRS-0184 ,無法訪問OCR物理裝置;
最開始crs服務沒有起來,root /etc/init.d/init.crs start
Oracle crs_start -all 始終 報錯CRS-0184
/tmp目錄下有生成一些crs相關的臨時日誌檔案報錯
再次停機,將壞的HBA卡光纖線拔掉,fdisk –l
powermt display dev=all
fdisk –l|grep ‘ ‘ 比對節點1和節點2的裝置名稱,然後將節點2上變化的裝置序號重新命名調整為和節點1一致,因為之前兩個節點上識別的裝置序號就是一致的。
emcpadm renamepseudo –s emcpowerx –t emcpowerz
中間還碰到裝置名稱已經被使用,無法重新命名問題,後來想辦法透過使用過渡名稱解決了;
還有剩下幾個裝置名稱多次嘗試始終無法修改,後來發現節點crs等服務自動起來了,可能是某些裝置已經被使用了,所以無法重新命名;於是我果斷停oracle相關服務,果然馬上能重新命名了。全部重新命名完成後儲存下配置powermt save,啟動節點相關服務,正常。
教訓:
維護工作儘量放到沒有業務時操作,如晚上
詳細的實施方案,審批流程規範
對所做的工作應該非常清楚詳細步驟及風險、所需的時間等,全面控制
向客戶申請維護視窗時,在估計所需的時間上加一些時間,以防出現意外情況
……
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/17172228/viewspace-1077980/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- oracle RAC 更換儲存遷移資料Oracle
- 儲存崩潰導致資料丟失如何處理
- 處理rac資料庫一個節點監聽異常資料庫
- Oracle 10g RAC 資料儲存更換Oracle 10g
- 【RAC】儲存陣列電源故障導致RAC資料庫異常掛起陣列資料庫
- 關於RAC共享儲存兩個節點磁碟裝置名稱不一致的問題
- ORACLE RAC 裸裝置資料庫一節點表空間擴容錯誤新增資料檔案到本地的處理Oracle資料庫
- 【RAC】RAC更換心跳地址和RAC更換儲存主要步驟
- 【伺服器儲存裝置資料恢復】EMC儲存裝置POOL上的資料卷被刪除的資料恢復案例伺服器資料恢復
- 記一次儲存問題導致的rac故障案例
- 使用SQLServerAudit記錄資料庫變更SQLServer資料庫
- inode節點耗盡導致資料庫OOM資料庫OOM
- RAC變更ASMSPFILE儲存位置(轉)ASM
- ORACLE windows驅動磁碟機代號自動變更導致oracle資料庫崩潰無法啟動OracleWindows資料庫
- 【RAC】處理因ASM例項異常導致RAC第一節點例項異常終止故障ASM
- Linux下更換HBA卡重新掃盤Linux
- 儲存卡變為RAW,如何進行儲存卡資料救援
- 儲存多路徑故障導致資料庫死掉案例資料庫
- 儲存裝置許可權不對導致crs啟動出錯
- RAC資料庫心跳更換方案資料庫
- RAC資料庫只能啟動一個節點的故障資料庫
- asm例項自動dismount導致rac一個節點當機ASM
- Redhat 5.3 安裝hba卡,配置emc powerpath,配置LVMRedhatLVM
- HP-UX+11.2.0.3RAC因裸裝置許可權不一致導致RAC一個節點報錯的解決UX
- vscode外掛導致c盤記憶體高電腦變卡的處理方式,更換vscode外掛位置VSCode記憶體
- 【RAC】刪除RAC資料庫節點(一)——刪除資料庫例項資料庫
- RAC環境單獨節點插入資料也會導致全域性等待(一)
- DBus資料庫表結構變更處理方案資料庫
- 由於目錄變更引起的資料服務無法啟動的問題處理記錄
- 如何恢復SD卡相機儲存卡等USB裝置資料丟失?SD卡
- Mysql更換MyISAM儲存引擎為Innodb的操作記錄MySql儲存引擎
- 動態Zookeeper節點變更
- RAC遷移之更換主機裝置
- Kubernetes 遷移節點 Kubelet 資料儲存目錄
- 查詢hba卡wwn號
- 記一次:歸檔檔案系統問題導致資料庫hang處理資料庫
- Redhat 5.3 安裝hba卡,配置emc powerpath,配置LVM-轉RedhatLVM
- ORACLE 11.2.0.4 for solaris更換硬體後主機時間改變導致一節點叢集服務無法啟動Oracle