Linux平臺由於OPROCD程式導致伺服器重啟的問題
Linux平臺由於OPROCD程式導致伺服器重啟的問題
由於oprocd程式的超時等引數預設值過小有可能導致機器在安裝、升級、執行等情況重啟。特別是在虛擬機器搭建的RAC測試環境問題更為突出。
解決辦法:
編輯/etc/init.d/init.cssd
修改一下2個值:
OPROCD_DEFAULT_TIMEOUT=10000
OPROCD_DEFAULT_MARGIN=5000
[root@rhel1 bin]# ps -ef | grep oprocd
root 3842 2936 0 13:05 ? 00:00:00 /bin/sh /etc/init.d/init.cssd oprocd
root 4191 3842 0 13:05 ? 00:00:00 /u01/app/oracle/crs/bin/oprocd.bin run -t 10000 -m 5000 -f
OPROCD啟動的時候有兩個引數:
-t : 超時時間,預設1000,單位毫秒 (OPROCD_DEFAULT_TIMEOUT=1000)
-m : 重啟前可接受的延遲,單位毫秒,預設500 (OPROCD_DEFAULT_MARGIN=500)
oprocd程式介紹:
PROCD is a process monitor that runs on hardware platforms supporting
other third-party cluster managers and is present only on hardware platforms
other than Linux. Its function is to create threads for the various processors
on the system and to check if the processors are hanging. Every
second, the PROCD thread wakes up and checks the processors on the system,
and then goes to sleep for about 500 ms and tries again. If it does not
receive any response after n seconds, it reboots the node. On Linux environments,
the hangcheck timer module performs the same work that PROCD
does on other hardware platforms.
linux平臺上的Oracle Clusterware 10.2.0.4和以後版本引入了一個新的Oracle Clusterware Process Monitor Daemon (OPROCD)程式來監控系統狀態和叢集中的每個節點的健康狀態,就象已經在不使用第三方的cluster軟體的UNIX系統中提供的那樣。
OPROCD在linux平臺上的10.2.0.4版本中和hangcheck-timer一起執行,它和hangcheck-timer模組沒有聯絡和依賴關係,它由init.ccsd程式產生出來並用root使用者執行。OPROCD程式被鎖定在記憶體中來監控叢集中的每個它自己執行的節點,來檢測機器上的硬體或者驅動的freezes,並且提供I/O的fencing功能(這和SCSI提供的中斷的fencing功能不同)。如果一個機器被凍結了足夠長的時間後,它被會叢集驅逐出節點,它自己需要強制重啟自己來阻止叢集從失敗的節點上的鎖資源被重新組織後,失敗的節點仍然訪問共享的資料檔案上的有疑問的I/O操作。為了提供這樣的功能,OPROCD執行檢查,然後停止執行(休眠),然後如果在期望的時間內不能被喚醒,OPROCD將重啟本機的節點。
注意:OPROCD在第三方實現的叢集環境中是不存在的,因為在LINUX平臺下沒有透過驗證的第三方的叢集解決方案,所以linux平臺下的10.2.0.4版本中OPROCD將總是會存在的。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/23135684/viewspace-660176/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 伺服器由於防火牆問題導致埠不通解決方法伺服器防火牆
- OPROCD程式問題(ZT)
- LINUX平臺下的10.2.0.4版本的CLUSTERWARE引入的變化-關於OPROCD程式Linux
- Laravel 關聯模型由於名稱一致性導致的問題Laravel模型
- linux伺服器重啟指令Linux伺服器
- spring boot 2.0.0由於版本不匹配導致的NoSuchMethodError問題解析Spring BootError
- 由於CND cache導致的小程式使用者資訊串號的線上問題回顧
- 伺服器重啟伺服器
- MYSQL 5.7 升級 8.0 後的 由於字符集導致的大問題 ?MySql
- oracle兩節點RAC,由於gipc導致某節點crs無法啟動問題分析Oracle
- 由於字符集問題導致 Package Body created with compilation errors.PackageError
- java由於越界導致的報錯Java
- crontab設定導致的伺服器程式異常問題伺服器
- 關於JAVAMAIL導致JSP伺服器停止的問題!急JavaAIJS伺服器
- 由一條sql語句導致的系統IO問題SQL
- 優化由直方圖資訊導致的sql效能問題優化直方圖SQL
- 伺服器重啟流程伺服器
- 運維該如何解決 Linux 伺服器重啟後命令無法正常使用的問題?運維Linux伺服器
- 伺服器重灌系統導致分割槽丟失的恢復方法伺服器
- 記錄一個由於倉庫層錯誤導致軟刪除失效的問題
- dba工作一定要細心:由於不細心導致的一個小問題
- 關於 Laravel mix 導致 Bootstrap 失效的問題Laravelboot
- Linux下共享庫問題導致無法啟動SQLPLUS的問題解決LinuxSQL
- 伺服器重啟的命令有哪些伺服器
- 【Cocos2d-x】遮蔽Emoji並解決由於Emoji導致的崩潰問題
- a-select由於位置不夠,導致下拉選單擋住搜尋框的問題
- 由Nginx的DNS快取導致的訪問404NginxDNS快取
- AIX下由於nfs故障導致oracle hangAINFSOracle
- SCHEDULER呼叫XDB程式導致效能問題
- 由於無法分配ip而導致的FailedCreatePodSandBoxAI
- 關於沒有熔斷降級導致服務重啟問題
- echarts圖由於容器隱藏導致圖表不顯示問題解決辦法Echarts
- 由於基本資料型別使用姿勢不對導致的線上"死迴圈"問題排查資料型別
- VXFS啟用非同步IO導致的嚴重問題非同步
- linux平臺上rmi使用的問題Linux
- 關於log4j.jar導致的中文問題JAR
- 使用Nginx解決IIS繫結域名導致應用程式重啟的問題Nginx
- Linux 設定錯誤的DNS 伺服器導致網路傳輸慢的問題LinuxDNS伺服器