當votedisk只有一份的時候,可能出現BUG:CSSD程式會因為找不到votedisk而crash,從而導致DB無法與ASM通訊,最終instance關閉
CSSD aborting from thread clssnmvDiskPingMonitorThread
當votedisk只有一份的時候,可能出現BUG:CSSD程式會因為找不到votedisk而crash,從而導致DB無法與ASM通訊,最終instance關閉。
此為Oracle的bug。
引發bug的原因未知。
由於voting disk在asm中,安裝時,只有1個(使用了外部冗餘策略),在只有一個voting disk時,當csstd程式與voting disk進行通訊時,由於bug,會發生無法通訊,導致程式關閉,從而又導致了asm與db無法通訊,所以db出現當機。
相關文件:
ASM Crashed Due to CSS Crash With Voting File Checks [ID 1468826.1]
11.2.0.3 Node Reboot With "CSSD aborting from thread clssnmvDiskPingMonitorThread" if Only one Voting Disk/File is Configured [ID 1466639.1]
錯誤日誌:
ocssd_node1.log
----------------------
2012-08-13 03:17:42.765: [ CSSD][1109031232]clssnmSendingThread: sent 5 status msgs to all nodes
2012-08-13 03:17:47.766: [ CSSD][1109031232]clssnmSendingThread: sending status msg to all nodes
2012-08-13 03:17:47.766: [ CSSD][1109031232]clssnmSendingThread: sent 5 status msgs to all nodes
2012-08-13 03:17:49.983: [ CSSD][1091426624](:CSSNM00018:)clssnmvDiskCheck: Aborting, 0 of 1 configured voting disks available, need 1
2012-08-13 03:17:49.984: [ CSSD][1091426624]###################################
2012-08-13 03:17:49.984: [ CSSD][1091426624]clssscExit: CSSD aborting from thread clssnmvDiskPingMonitorThread
2012-08-13 03:17:49.984: [ CSSD][1091426624]###################################
2012-08-13 03:17:49.984: [ CSSD][1091426624](:CSSSC00012:)clssscExit: A fatal error occurred and the CSS daemon is terminating abnormally
2012-08-13 03:17:49.984: [ CSSD][1091426624]
2012-08-13 03:17:49.984: [ CSSD][1091426624]calling call entry argument values in hex
2012-08-13 03:17:49.984: [ CSSD][1091426624]location type point (? means dubious value)
2012-08-13 03:17:49.984: [ CSSD][1091426624]-------------------- -------- -------------------- ----------------------------
2012-08-13 03:17:49.989: [ CSSD][1091426624]clssscExit()+740 call kgdsdst() 000000000 ? 000000000 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624] 0410D8568 ? 000000001 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624] 000000001 ? 000000003 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624]clssnmvDiskCheck()+ call clssscExit() 7FC21424A8A0 ? 000000002 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624]3356 0410D8568 ? 000000001 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624] 000000001 ? 000000003 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624]clssnmvDiskPingMoni call clssnmvDiskCheck() 7FC21424A8A0 ? 7FC2140A3C40 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624]torThread()+423 0410DD0B8 ? 000000000 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624] 000000001 ? 000000003 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624]clssscthrdmain()+25 call clssnmvDiskPingMoni 7FC21424A8A0 ? 7FC2140A3C40 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624]3 torThread() 0410DD0B8 ? 000000000 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624] 000000001 ? 000000003 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624]start_thread()+221 call clssscthrdmain() 7FC21424A8A0 ? 7FC2140A3C40 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624] 7FC2140A3C40 ? 000000000 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624] 000000001 ? 000000003 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624]clone()+109 call start_thread() 0410DD940 ? 7FC2140A3C40 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624] 7FC2140A3C40 ? 000000000 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624] 000000001 ? 000000003 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624]0000000000000000 call clone() 0410DD940 ? 7FC2140A3C40 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624] 7FC2140A3C40 ? 000000000 ?
2012-08-13 03:17:49.990: [ CSSD][1091426624] 000000001 ? 000000003 ?
...
ocssd_node2.log
----------------------
2012-08-13 03:17:47.716: [ CSSD][1110337856]clssnmSendingThread: sending status msg to all nodes
2012-08-13 03:17:47.717: [ CSSD][1110337856]clssnmSendingThread: sent 5 status msgs to all nodes
2012-08-13 03:17:50.011: [ CSSD][1113491776]clssnmHandleMeltdownStatus: node node1, number 1, has experienced a failure in thread number 9 and is shutting down
2012-08-13 03:17:52.336: [GIPCHAUP][1102911808] gipchaUpperProcessDisconnect: processing DISCONNECT for hendp 0x7f86184a7b40 [0000000000000845] { gipchaEndpoint : port 'gm2_crs/f483-4e28-b94b-8942', peer 'node1:9a12-5b0a-0d30-d102', srcCid 00000000-00000845, dstCid 00000000-00007cb4, numSend 0, maxSend 100, groupListType 1, hagroup 0x7f86100468a0, usrFlags 0x4000, flags 0x204 }
2012-08-13 03:17:52.336: [ CSSD][1113491776]clssnmHandleManualShut: Manual shutdown of node nodename node1 nodenum 1
2012-08-13 03:17:52.337: [ CSSD][1113491776]clssnmMarkNodeForRemoval: node 1, node1 marked for removal
解決方法:
由於現在的系統環境中,使用了ASM外部冗餘策略:
而且該冗餘模式下無法增加voting disk,原因是取決了上述的ASM冗餘策略,為此,只能是打補丁去避免這個bug了。。。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/786540/viewspace-1059183/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 由於無法分配ip而導致的FailedCreatePodSandBoxAI
- linux終端關閉時為什麼會導致在其上啟動的程式退出?Linux
- 神奇的DEBUG:因為異常導致MongoDB容器無法啟動MongoDB
- votedisk在ASM diskgroup上的存放規律ASM
- votedisk的操作
- vnc圖形介面登陸和訊號無法分配而db無法nomountVNC
- 遷移ocr/votedisk/asm spfile所在磁碟組ASM
- RAC共享磁碟物理路徑故障導致OCR、Votedisk所在ASM磁碟組不可訪問的案例分析ASM
- [譯] RxJS: 避免因濫用 switchMap 而導致錯誤JS
- 時刻為下一份工作而準備
- 老闆會因為你拼命寫程式碼而感謝你嗎?
- vip/public ip斷網,導致instance crash
- TSM備份時因歸檔日誌丟失而導致備份失敗
- 程式設計師因為女孩而美麗!程式設計師
- 存貯在asm中的ocr/votedisk/asm磁碟組損害的恢復ASM
- 老闆會因為你拼命編寫程式碼而感謝你嗎?
- terminating the instance due to error481導致ASM無法啟動故障ErrorASM
- ASM例項出現ORA-04031導致Instance terminated by ASMBASM
- canvas因為圖片資源不在同一域名下而導致的跨域汙染畫布的解決辦法Canvas跨域
- AI因資料而燃,行業因AI而變AI行業
- 微信小程式版本控制工具無法關閉的bug微信小程式
- 11gR2 OCR&VOTEDISK 從ASM向裸裝置遷移(EXPIMP方式)ASM
- 慎用sys_context,可能導致無法正確的bind_peeking,而選擇錯誤的執行計劃Context
- mongoDB因root啟動關閉資料庫導致mongo普通使用者無法啟動MongoDB資料庫
- 因為跨域問題導致的無法讀取 response header跨域Header
- 6大原因導致「最安全的程式」也會出現隱患!
- openGauss 由於RemoveIPC未關閉導致資料庫crashREM資料庫
- maven因為換了配置檔案而導致所有的jar包都匯入不進來 (JDK8升級JDK11的時候碰到的問題)MavenJARJDK
- service會不會因repository而變得也很薄
- TSM配置不好導致備份不正常,從而導致資料庫效能問題資料庫
- ORACLE DSG資料同步軟體程式導致資料庫無法正常關閉Oracle資料庫
- windows終端下mysql無法正常關閉WindowsMySql
- 【ASM】RAC19C因引數設定不當,asm無法啟動ASM
- 如何定位導致Crash的程式碼位置
- eclipse異常關閉 導致tomcat 6.0 無法重啟EclipseTomcat
- 你的人生有沒有因為意外而改變?你知道哪些因意外而產生價值的事件?事件
- 因需而變 因御而安!東軟何以護航雲端計算?
- Oracle OCR和VOTEDISK故障修復Oracle