【ASK_ORACLE】Oracle RAC報錯“ipc send timeout”的原因以及解決辦法
實驗環境
搭建平臺:VMware Workstation
OS:RHEL 6.10
Grid&DB:Oracle 11.2.0.4
問題描述
例項被踢出時,檢視alert日誌發現了許多的“IPC send timeout” (IPC 傳送超時)錯誤。原因如下:
在RAC環境中,資料庫的程式(比如 lmon、lmd 和 lms )會不斷地和其他例項的程式通訊。lmd0 程式負責管理 enqueue,而 lms 程式負責管理資料塊資源並傳輸資料塊以支援 Cache Fusion。如果這些程式中的一個或多個受阻、死迴圈或異常繁忙,都可能導致“IPC send timeout”錯誤。
lmon、lms 和 lmd 程式報告“IPC send timeout”錯誤的另一個原因是網路問題或伺服器資源(CPU 和記憶體)問題。這些程式可能無法獲得 CPU 執行排程或這些程式傳送的網路資料包丟失。涉及 lmon、lmd 和 lms 程式的通訊問題導致例項被踢出。
因此此報錯通常伴隨資料庫效能問題!
alert日誌的報錯資訊如下:
......
IPC Send timeout detected.Sender: ospid 1587
Receiver: inst 6 binc 738274875 ospid 29098
......
如果某例項被踢出,除了alert日誌中的“IPC Send timeout detected”的報錯還可能涉及到如 ora-29740 和腦裂“Waiting for clusterware split-brain resolution”。
解決辦法
這裡提供幾種方案來排查(解決方法和ora-29740的解決方案一致,詳見 http://blog.itpub.net/69992972/viewspace-2789808/):
1) 檢查網路,比如 UDP 錯誤或 IP 資料包丟失或故障錯誤
2) 檢查網路配置,確保所有節點上的所有網路配置均設定正確。例如,所有節點上 MTU 的大小必須相同,並且如果使用巨幀,交換機也能夠支援大小為 9000 的 MTU
3) 檢查伺服器是否存在 CPU 負載問題或可用記憶體不足
4) 檢查資料庫在例項被踢出之前是否正處於掛起狀態或存在嚴重的效能問題
5) 檢查 CHM (Cluster Health Monitor) 輸出,檢視伺服器是否存在 CPU 或記憶體負載問題、網路問題或者 lmd 或 lms 程式出現死迴圈
6) 使用 OSWatcher 來進行監控
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69992972/viewspace-2789814/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- IPC Send timeout detected
- ORACLE 9I RAC IPC Send timeout detected問題處理Oracle
- IPC Send timeout故障現象
- 【RAC】如何診斷RAC資料庫上的“IPC Send timeout”問題資料庫
- 如何診斷RAC資料庫上的“IPC Send timeout”問題?資料庫
- 【問題處理】IPC Send timeout detected
- 【ASK_ORACLE】RAC節點自動重啟但日誌裡未報錯的原因和解決方法Oracle
- 【ASK_ORACLE】導致ora-29740報錯的可能原因和對應的解決方案Oracle
- 【ASK_ORACLE】LOCK_SGA引數失效的解決辦法Oracle
- oracle 10g emctl 報錯的解決辦法Oracle 10g
- IPC Send timeout detected. Receiver ospid 25822
- git報錯400的解決辦法Git
- sysctl -P 報錯解決辦法
- oracle rac asm 問題的官方解決辦法OracleASM
- Oracle死鎖的檢視以及解決辦法Oracle
- cnpm link 報錯解決辦法NPM
- 安裝RAC 執行root.sh指令碼報錯,解決辦法指令碼
- ORA-39006錯誤原因及解決辦法
- stm出現Flash Timeout解決辦法
- 【故障-ORACLE】rdbms ipc message timeout解釋Oracle
- 建庫時EM報錯的解決辦法
- 連線oracle錯誤解決辦法Oracle
- oracle 1455 錯誤解決辦法Oracle
- 連線IBM websphere MQ原因碼報2035的錯誤解決辦法IBMWebMQ
- Mybatis批量更新SQL報錯☞解決辦法MyBatisSQL
- 執行Docker命令報錯解決辦法Docker
- isNaN("abc")編譯報錯解決辦法NaN編譯
- RocketMQ的invokeSync call timeout異常的解決辦法MQ
- 安裝ionic 報錯 安裝canvas報錯 解決辦法Canvas
- 寬頻連線錯誤769原因與解決辦法
- jenkins - svn: E170001報錯的原因以及解決方案Jenkins
- Nginx報504 gateway timeout錯誤的解決方法NginxGateway
- 微信域名被封的原因及解決辦法
- 印表機無法列印的原因與解決辦法
- Spark on mesos的坑以及解決辦法Spark
- Could not resolve host: 'localhost 報錯解決辦法localhost
- 安裝sysbench過程報錯,解決辦法
- IOConsole Updater 報錯解決辦法