Oracle RAC/Clusterware 多種心跳heartbeat機制介紹 RAC超時機制分析
ORACLE RAC中最主要存在2種clusterware叢集件心跳 & RAC超時機制分析:
1、Network Heartbeat 網路心跳 每秒發生一次; 10.2.0.4以後網路心跳超時misscount為60s,;11.2以後網路心跳超時misscount為30s。
2、Disk Heartbeat 磁碟心跳 每秒發生一次; 10.2.0.4以後 磁碟心跳超時DiskTimeout為200s。
注意不管是磁碟心跳還是網路心跳都依賴於cssd.bin程式來實施這些操作,在真實世界中任何造成cssd.bin這個普通使用者程式無法正常工作的原因均可能造成上述2種心跳超時, 原因包括但不侷限於 CPU無法分配足夠的時間片、記憶體不足、SWAP、網路問題、Votedisk IO問題、本次磁碟IO問題等等(askmaclean.com)。
此外在使用ASM的情況下,DB作為ASM例項的Client客戶; ASM例項會對DB例項的ASMB等程式進行監控, 以保證DB與ASM之間通訊正常。 若DB的ASMB程式長期無響應(大約為200s)則ASM例項將考慮KILL DB的ASMB程式,由於ASMB是關鍵後臺程式所以將導致DB例項重啟。
也存在其他可能的情況,例如由於ASMB 被某些latch block, 會阻塞其他程式,導致PMON進行強制清理。
綜上所述不管是Clusterware的 cssd.bin程式還是ASMB程式,他們都是OS上的普通使用者程式,OS本身出現的問題、超時、延遲均可能造成它們無法正常工作導致。建議在確認對造成OS長時間的網路、IO延時的維護操作,考慮先停止節點上的Clusterware後再實施。
另可以考慮修改misscount、Disktimeout等 心跳超時機制為更大值,但修改這些值並不能保證就可以不觸發Node Evication。
關於RAC /CRS對於本地盤的問題,詳見如下的SR回覆:
Does RAC/CRS monitor Local Disk IO ?
Oracle software use local ORACLE_HOME / GRID_HOME library files for main process operations.
There are some socket files under /tmp or /var/tmp needed for CRS communication.
Also, the init processes are all depending on the /etc directory to spawn the child processes.
Again, this is a complicated design for a cluster software which mainly rely on the OS stability including local file system.
Any changes to storage / OS are all recommended to stop CRS services since those are out of our release Q/A tests.
由於10.2的環境已經超出我們開發的支援服務期限,建議考慮升級到11.2.0.3來獲得更全面的技術支援。
轉自
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31397003/viewspace-2136436/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- ORACLE RAC clusterwareOracle
- 【RAC】Oracle RAC如何修改心跳網路Oracle
- 【RAC】Oracle RAC上線測試場景介紹Oracle
- 螞蟻金服通訊框架 SOFABolt 解析 | 超時控制機制及心跳機制框架
- Ceph心跳機制
- 心跳檢測機制
- 【NETWORK】Oracle RAC 心跳地址配置說明Oracle
- jQuery的事件機制,事件物件介紹,外掛機制,多庫共存,each()jQuery事件物件
- Hystrix超時機制
- Oracle RAC DRM介紹和關閉DRMOracle
- xxl-job心跳機制
- 聊聊心跳機制及netty心跳實現Netty
- OkHttpClient原始碼分析(三)—— 快取機制介紹HTTPclient原始碼快取
- Spring的Factories機制介紹Spring
- Spark RPC框架原始碼分析(三)Spark心跳機制分析SparkRPC框架原始碼
- Oracle:RAC 程式簡介Oracle
- Kafka消費與心跳機制Kafka
- Flink 類載入機制介紹
- linux漏洞緩解機制介紹Linux
- Networker恢復oracle rac到單機Oracle
- 【RAC】RAC更換心跳地址和RAC更換儲存主要步驟
- ORACLE 12C RAC 生產環境搭建介紹Oracle
- 沃趣微講堂 | Oracle叢集技術(五):叢集中的三種心跳機制Oracle
- Oracle 11.2 DataGuard RAC To RAC搭建Oracle
- Oracle RAC簡介與要點Oracle
- oracle RACOracle
- 理解WebSocket心跳及重連機制(五)Web
- Oracle RAC Cache Fusion 系列十七:Oracle RAC DRMOracle
- 簡單介紹python的垃圾回收機制Python
- Nginx 超時事件的處理機制Nginx事件
- Golang利用select實現超時機制Golang
- Oracle多粒度封鎖機制研究二(zt)Oracle
- Oracle RAC CacheFusion 系列十五:Oracle RAC CRServer Part TwoOracleServer
- Netty(一) SpringBoot 整合長連線心跳機制NettySpring Boot
- Oracle rac時間不同步Oracle
- 資料庫系列:MySQL InnoDB鎖機制介紹資料庫MySql
- SAP S/4HANA Cross Selling機制介紹ROS
- Flink狀態管理和容錯機制介紹
- RAC資料庫心跳更換方案資料庫