【故障處理】一次RAC故障處理過程
【故障處理】一次RAC故障處理過程
1.1 故障環境介紹
專案 |
source db |
db 型別 |
2節點RAC |
db version |
11.2.0.1.0 |
db 儲存 |
ASM |
OS版本及kernel版本 |
RHEL 6.6 |
1.2 故障處理過程
晚上10點多,一個網友喊我幫忙處理RAC當機不能啟動的問題,並且告知涉及到多路徑和儲存的事。小麥苗對儲存一向不太懂,多路徑也沒怎麼接觸,自己也沒研究過這個東西。既然找到了我,那就不能不管啊,硬著頭皮上去看看。結果悲催了,搞了N個小時,求助了N個人,搞到第二天中午,終於搞定了,幸運的是第二天是週末,不用上班。小麥苗把處理過程記錄一下,希望我的處理過程可以幫到更多人。
剛開始上去看的時候,節點1的css不能啟動,報了一大堆的錯誤,節點2的ha也不能正常啟動。錯誤我忘記記錄了,反正是各種研究日誌,各種查MOS,各種百度,各種Google,包括OCR的還原都試了,最後沒辦法了,只有使用個人常用的絕招了,那就是。。。。。重新執行root.sh指令碼。
關於該指令碼的執行,我在個人部落格中有多次提到。不過還是得多練練,因為注意事項很多。首先,如果要保持磁碟組不被刪除,那麼執行解除安裝命令($ORACLE_HOME/crs/install/rootcrs.pl -deconfig -force -verbose)可以加上-keepdg選項,但是11.2.0.1沒有該選項。在第二個節點上執行解除安裝的時候可以不用加-lastnode,儘可能多的保留資訊。
很幸運,小麥苗第一次執行後,叢集可以正常啟動了,一切安好,從10點熬到1點了吧。結果在準備匯入OCR的備份的時候,需要以exec模式啟動CRS,結果又悲催了,叢集壞掉了。沒辦法,只得重啟,重啟更悲催,OCR的盤找不到了。小麥苗想放棄了。盤找不到,我更沒辦法了。只得找找懂儲存的人來弄了。差不多2點了。好吧,該休息了。
早上8點多,睜眼就趕緊登teamviewer,繼續處理。首先搗鼓了半天的多路徑。原來第二個節點的多路徑軟體有問題,自己就重新安裝了一下。安裝後期望能看到磁碟,結果還是不行。無奈,在leshami的群裡找找懂儲存的高手來。肖總幫我上去看了看弄好了儲存,找到了磁碟,萬分感謝。
接下來就繼續進行恢復操作,繼續deconfig,然後root.sh。執行完root.sh後發現叢集正常,自己嘗試重啟了一下主機,一切正常,看來就是儲存搞得鬼。那就繼續恢復資料庫,這個是重點。由於整個操作過程都小心翼翼不敢動非OCR的盤,生怕資料搞丟了,因為10T的資料什麼備份都沒有,我也是醉了。用kfod看了一下磁碟,一切正常,好吧,那就接下來直接MOUNT磁碟組。重新執行root.sh後只要磁碟組的磁碟檔案沒有損壞,那麼就可以直接MOUNT起來的。這也是在無備份情況下恢復OCR的一種辦法。
接下來一切都很順利,例如配置監聽,新增DB到srvctl管理器等,真是佛祖保佑。很多處理日誌並沒有記錄,所以這裡只能給出一些指令碼了。
1.2.1 處理過程中用到的一些指令碼
重新執行root.sh指令碼特別需要注意的是資料庫的資料是否放在OCR磁碟組上。若放在OCR磁碟組上切記不能隨意執行該指令碼。
1、2個節點分別執行deconfig:
export ORACLE_HOME=/u01/app/11.2.0/grid export PATH=$PATH:$ORACLE_HOME/bin $ORACLE_HOME/crs/install/rootcrs.pl -deconfig -force -verbose |
2、執行完後,需要對OCR盤進行dd,2個節點都執行:
dd if=/dev/zero of=/dev/oracleasm/disks/OCR_VOL2 bs=1024k count=1024 dd if=/dev/zero of=/dev/oracleasm/disks/OCR_VOL1 bs=1024k count=1024 |
3、節點1執行完後再在節點2執行:
export ORACLE_HOME=/u01/app/11.2.0/grid $ORACLE_HOME/root.sh |
另外,對於11.2.0.1版本執行root.sh有一個常見的bug錯誤:
CRS-4124: Oracle High Availability Services startup failed. CRS-4000: Command Start failed, or completed with errors. ohasd failed to start: Inappropriate ioctl for device ohasd failed to start: Inappropriate ioctl for device at /u01/app/11.2.0/grid/crs/install/roothas.pl line 296. |
該錯誤的解決辦法就是:
就是在執行root.sh之前執行以下命令
/bin/dd if=/var/tmp/.oracle/npohasd of=/dev/null bs=1024 count=1 |
如果出現
/bin/dd: opening`/var/tmp/.oracle/npohasd': No such file or directory |
的時候檔案說明相關檔案還沒生成,那就繼續執行,直到能執行為止,一般出現Adding daemon to inittab這條資訊的時候執行dd命令。
1.2.2 root.sh的配置指令碼
root.sh的一些配置放在如下的指令碼中,包括要建立的OCR盤的名稱,磁碟路徑等:
$ORACLE_HOME/crs/config/config.sh |
1.2.3 kfod命令
該命令可以顯示所有的磁碟資訊:
data01->export ORACLE_HOME=/u01/app/11.2.0/grid data01->$ORACLE_HOME/bin/kfod disk=all s=true ds=true c=true
-------------------------------------------------------------------------------- Disk Size Header Path Disk Group User Group ================================================================================ 1: 476837 Mb MEMBER /dev/oracleasm/disks/DATA_VOL1 DATA grid asmadmin 2: 953674 Mb MEMBER /dev/oracleasm/disks/DATA_VOL10 DATA grid asmadmin 3: 953674 Mb MEMBER /dev/oracleasm/disks/DATA_VOL11 DATA grid asmadmin 4: 953675 Mb MEMBER /dev/oracleasm/disks/DATA_VOL12 DATA grid asmadmin 5: 953674 Mb MEMBER /dev/oracleasm/disks/DATA_VOL13 DATA grid asmadmin 6: 953674 Mb MEMBER /dev/oracleasm/disks/DATA_VOL14 DATA grid asmadmin 7: 953674 Mb MEMBER /dev/oracleasm/disks/DATA_VOL15 DATA grid asmadmin 8: 953674 Mb MEMBER /dev/oracleasm/disks/DATA_VOL16 DATA grid asmadmin 9: 953675 Mb MEMBER /dev/oracleasm/disks/DATA_VOL18 DATA grid asmadmin 10: 953675 Mb MEMBER /dev/oracleasm/disks/DATA_VOL2 DATA grid asmadmin 11: 953674 Mb MEMBER /dev/oracleasm/disks/DATA_VOL3 DATA grid asmadmin 12: 953674 Mb MEMBER /dev/oracleasm/disks/DATA_VOL4 DATA grid asmadmin 13: 953675 Mb MEMBER /dev/oracleasm/disks/DATA_VOL5 DATA grid asmadmin 14: 953674 Mb MEMBER /dev/oracleasm/disks/DATA_VOL6 DATA grid asmadmin 15: 953674 Mb MEMBER /dev/oracleasm/disks/DATA_VOL7 DATA grid asmadmin 16: 953674 Mb MEMBER /dev/oracleasm/disks/DATA_VOL8 DATA grid asmadmin 17: 953675 Mb MEMBER /dev/oracleasm/disks/DATA_VOL9 DATA grid asmadmin 18: 476837 Mb MEMBER /dev/oracleasm/disks/FLASH_VOL1 FLASH grid asmadmin 19: 286103 Mb MEMBER /dev/oracleasm/disks/FLASH_VOL2 FLASH grid asmadmin 20: 286057 Mb MEMBER /dev/oracleasm/disks/OCR_VOL1 OCR grid asmadmin 21: 286102 Mb CANDIDATE /dev/oracleasm/disks/OCR_VOL2 # grid asmadmin 22: 476837 Mb MEMBER ORCL:DATA_VOL1 DATA <unknown> <unknown> 23: 953674 Mb MEMBER ORCL:DATA_VOL10 DATA <unknown> <unknown> 24: 953674 Mb MEMBER ORCL:DATA_VOL11 DATA <unknown> <unknown> 25: 953675 Mb MEMBER ORCL:DATA_VOL12 DATA <unknown> <unknown> 26: 953674 Mb MEMBER ORCL:DATA_VOL13 DATA <unknown> <unknown> 27: 953674 Mb MEMBER ORCL:DATA_VOL14 DATA <unknown> <unknown> 28: 953674 Mb MEMBER ORCL:DATA_VOL15 DATA <unknown> <unknown> 29: 953674 Mb MEMBER ORCL:DATA_VOL16 DATA <unknown> <unknown> 30: 953675 Mb MEMBER ORCL:DATA_VOL18 DATA <unknown> <unknown> 31: 953675 Mb MEMBER ORCL:DATA_VOL2 DATA <unknown> <unknown> 32: 953674 Mb MEMBER ORCL:DATA_VOL3 DATA <unknown> <unknown> 33: 953674 Mb MEMBER ORCL:DATA_VOL4 DATA <unknown> <unknown> 34: 953675 Mb MEMBER ORCL:DATA_VOL5 DATA <unknown> <unknown> 35: 953674 Mb MEMBER ORCL:DATA_VOL6 DATA <unknown> <unknown> 36: 953674 Mb MEMBER ORCL:DATA_VOL7 DATA <unknown> <unknown> 37: 953674 Mb MEMBER ORCL:DATA_VOL8 DATA <unknown> <unknown> 38: 953675 Mb MEMBER ORCL:DATA_VOL9 DATA <unknown> <unknown> 39: 476837 Mb MEMBER ORCL:FLASH_VOL1 FLASH <unknown> <unknown> 40: 286103 Mb MEMBER ORCL:FLASH_VOL2 FLASH <unknown> <unknown> 41: 286057 Mb MEMBER ORCL:OCR_VOL1 OCR <unknown> <unknown> 42: 286102 Mb CANDIDATE ORCL:OCR_VOL2 # <unknown> <unknown> -------------------------------------------------------------------------------- ORACLE_SID ORACLE_HOME HOST_NAME ================================================================================ +ASM1 /u01/app/11.2.0/grid data01 +ASM2 /u01/app/11.2.0/grid data02 data01-> data01-> data01-> data01->sqlplus / as sysasm
SQL*Plus: Release 11.2.0.1.0 Production on Sat Dec 10 12:27:25 2016
Copyright (c) 1982, 2009, Oracle. All rights reserved.
Connected to: Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 - 64bit Production With the Real Application Clusters and Automatic Storage Management options
SQL> SQL> SQL> alter diskgroup OCR ADD DISK '/dev/oracleasm/disks/OCR_VOL2';
Diskgroup altered.
|
1.2.4 新增db到srvctl管理器中
11.2.0.1沒有-c引數,那就去掉,可以用-h檢視具體用法:
srvctl add database -d DGPHY -c RAC -o /oracle/app/oracle/product/11.2.0/db -p '+DATA/TESTDGPHY/PARAMETERFILE/spfiledgphy.ora' -r primary -n TESTDG
srvctl add instance -d DGPHY -i DGPHY1 -n ZFZHLHRDB1 srvctl add instance -d DGPHY -i DGPHY2 -n ZFZHLHRDB2
srvctl status database -d DGPHY srvctl start database -d TESTDG
|
About Me
...............................................................................................................................
● 本文作者:小麥苗,只專注於資料庫的技術,更注重技術的運用
● 本文在itpub(http://blog.itpub.net/26736162)、部落格園(http://www.cnblogs.com/lhrbest)和個人微信公眾號(xiaomaimiaolhr)上有同步更新
● 本文itpub地址:http://blog.itpub.net/26736162/viewspace-2130218/
● 本文部落格園地址:http://www.cnblogs.com/lhrbest/p/6157931.html
● 本文pdf版及小麥苗雲盤地址:http://blog.itpub.net/26736162/viewspace-1624453/
● QQ群:230161599 微信群:私聊
● 聯絡我請加QQ好友(642808185),註明新增緣由
● 於 2016-12-09 22:00 ~ 2016-12-10 16:00 在在泰興公寓完成
● 文章內容來源於小麥苗的學習筆記,部分整理自網路,若有侵權或不當之處還請諒解
● 版權所有,歡迎分享本文,轉載請保留出處
...............................................................................................................................
手機長按下圖識別二維碼或微信客戶端掃描下邊的二維碼來關注小麥苗的微信公眾號:xiaomaimiaolhr,免費學習最實用的資料庫技術。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/26736162/viewspace-2130218/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- HSG80故障處理過程
- WCDMA測試庫故障處理過程
- 一次dataguard故障處理
- 一次TM ENQ故障處理ENQ
- Oracle 10g RAC故障處理Oracle 10g
- MongoDB故障處理MongoDB
- 故障分析 | Greenplum Segment 故障處理
- [zt]Logical standby同步故障的處理過程
- 通過AWR報告處理故障一次心得
- 【原創】Oracle RAC故障分析與處理Oracle
- GPON網路故障如何處理?GPON網路故障處理流程
- 【故障處理】ORA-600:[13013],[5001]故障處理
- 【故障處理】ORA- 2730*,status 12故障分析與處理
- oracle 案例-控制檔案丟失故障處理過程Oracle
- linux故障處理Linux
- ora-故障處理
- 一次direct path read 故障處理
- 一次ORA-600故障的處理
- oracle 10g rac 網路故障處理Oracle 10g
- 【WebLogic故障處理】一次嚴重的WebLogic記憶體洩漏問題處理過程Web記憶體
- domino的java開發,找不到方法故障處理過程Java
- 【故障處理】DBCA建庫詭異問題處理--rac環境不能建立rac庫
- 線上故障處理手冊
- MySQL show processlist故障處理MySql
- 微服務的故障處理微服務
- teams登入故障處理
- Oracle更新Opatch故障處理Oracle
- 如何快速處理線上故障
- Mysql故障處理2則MySql
- dataguard故障處理一則
- AIX系統故障處理AI
- 【Linux】 nfs 故障處理LinuxNFS
- 記一次dg故障的處理總結
- ORACLE 10G rac故障處理一例Oracle 10g
- 記一次一波三折的Oracle RAC故障處理Oracle
- 【故障處理】CRS-1153錯誤處理
- 【故障處理】ORA-19809錯誤處理
- 一次RAC資源故障的處理 skgpspawn5 status 11 12