【ASK_ORACLE】Oracle RAC報錯“ipc send timeout”的原因以及解決辦法
實驗環境
搭建平臺:VMware Workstation
OS:RHEL 6.10
Grid&DB:Oracle 11.2.0.4
問題描述
例項被踢出時,檢視alert日誌發現了許多的“IPC send timeout” (IPC 傳送超時)錯誤。原因如下:
在RAC環境中,資料庫的程式(比如 lmon、lmd 和 lms )會不斷地和其他例項的程式通訊。lmd0 程式負責管理 enqueue,而 lms 程式負責管理資料塊資源並傳輸資料塊以支援 Cache Fusion。如果這些程式中的一個或多個受阻、死迴圈或異常繁忙,都可能導致“IPC send timeout”錯誤。
lmon、lms 和 lmd 程式報告“IPC send timeout”錯誤的另一個原因是網路問題或伺服器資源(CPU 和記憶體)問題。這些程式可能無法獲得 CPU 執行排程或這些程式傳送的網路資料包丟失。涉及 lmon、lmd 和 lms 程式的通訊問題導致例項被踢出。
因此此報錯通常伴隨資料庫效能問題!
alert日誌的報錯資訊如下:
......
IPC Send timeout detected.Sender: ospid 1587
Receiver: inst 6 binc 738274875 ospid 29098
......
如果某例項被踢出,除了alert日誌中的“IPC Send timeout detected”的報錯還可能涉及到如 ora-29740 和腦裂“Waiting for clusterware split-brain resolution”。
解決辦法
這裡提供幾種方案來排查(解決方法和ora-29740的解決方案一致,詳見 http://blog.itpub.net/69992972/viewspace-2789808/):
1) 檢查網路,比如 UDP 錯誤或 IP 資料包丟失或故障錯誤
2) 檢查網路配置,確保所有節點上的所有網路配置均設定正確。例如,所有節點上 MTU 的大小必須相同,並且如果使用巨幀,交換機也能夠支援大小為 9000 的 MTU
3) 檢查伺服器是否存在 CPU 負載問題或可用記憶體不足
4) 檢查資料庫在例項被踢出之前是否正處於掛起狀態或存在嚴重的效能問題
5) 檢查 CHM (Cluster Health Monitor) 輸出,檢視伺服器是否存在 CPU 或記憶體負載問題、網路問題或者 lmd 或 lms 程式出現死迴圈
6) 使用 OSWatcher 來進行監控
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69992972/viewspace-2789814/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【問題處理】IPC Send timeout detected
- 【ASK_ORACLE】RAC節點自動重啟但日誌裡未報錯的原因和解決方法Oracle
- 【ASK_ORACLE】導致ora-29740報錯的可能原因和對應的解決方案Oracle
- 【ASK_ORACLE】LOCK_SGA引數失效的解決辦法Oracle
- 【ASK_ORACLE】安裝Oracle RAC 12.2的GI軟體時報錯CLSRSC-614Oracle
- git報錯400的解決辦法Git
- ORA-39006錯誤原因及解決辦法
- stm出現Flash Timeout解決辦法
- cnpm link 報錯解決辦法NPM
- 【ASK_ORACLE】因process用盡導致的rac重啟的解決方法Oracle
- 【ASK_ORACLE】Oracle 19c RAC使用opatchauto安裝補丁報錯OPATCHAUTO-72083Oracle
- RocketMQ的invokeSync call timeout異常的解決辦法MQ
- Nginx報504 gateway timeout錯誤的解決方法NginxGateway
- Jsp Unescaped xml character報錯的解決辦法JSXML
- 報錯(已解決)Command timed out after no timeout
- Mybatis批量更新SQL報錯☞解決辦法MyBatisSQL
- msfconsole,OpenSSL::PKey::PKeyError報錯解決辦法Error
- ORACLE RAC中連線ScanIP報錯ORA-12545的問題解決Oracle
- zblog報錯:Undefined index: ZC SIDEBAR6 ORDER的原因和解決辦法UndefinedIndexIDE
- eclipse :報錯 ‘XXXX‘ does not name a type的解決辦法Eclipse
- Oracle的TNS-12502 錯誤原因及解決Oracle
- zblogphp1.6版本報錯“非法訪問”的原因和解決辦法PHP
- Docker Hello World容器執行報錯的解決辦法Docker
- 關於npm install安裝報錯的解決辦法NPM
- npm報錯"A complete log of this run can be found in:"的解決辦法NPM
- 報錯:net::err_unknown_url_scheme的解決辦法Scheme
- 微信域名被封的原因及解決辦法
- warning: LF will be replaced by CRLF in ** 的原因及解決辦法
- Switch to short timeout for ipc polling
- Laravel Mix - 執行 NPM install 報錯解決辦法LaravelNPM
- php png失真的原因及解決辦法PHP
- ORA-01034: ORACLE not available的解決辦法OracleAI
- Homestead 在 Windows 下軟連結報錯的解決辦法Windows
- Maven下載jar包慢,pom報錯的解決辦法MavenJAR
- MySQL5.7 group by新特性報錯1055的解決辦法MySql
- JavaScript 除錯常見報錯以及原因JavaScript除錯
- 伺服器出現500錯誤的原因和解決辦法伺服器
- Laravel 5.4 Mix執行 npm run dev時報錯,提示cross-env not found的原因及解決辦法LaravelNPMdevROS