10gR2 RAC 配置時間同步和hangcheck-timer模組

聽海★藍心夢發表於2011-11-12

1、配置時間同步

在安裝Oracle叢集件和Oracle資料庫軟體時,Oracle安裝程式將首先在本地節點上安裝軟體,然後再將軟體遠端複製到遠端節點。如果兩個RAC節點的日期和時間未同步,可能會收到類似於以下內容的錯誤:

"/bin/tar: ./inventory/Components21/oracle.ordim.server/10.2.0.1.0: time stamp 2010-12-04 06:24:04 is 25 s in the future"

 

所有節點的時間必須同步,這通常是透過配置NTP服務實現的。如果使用者的網路中已經有一個時間伺服器,那麼可以所有節點都指向它,否則可以從叢集中挑選一個節點作為時間伺服器,讓其他節點與它同步。

1)網路中有時間伺服器(本環境採取這種方式)

vi /etc/ntp.conf

 

server 192.168.1.7 prefer

driftfile /var/lib/ntp/drift

broadcastdelay 0.008

(2)網路中沒有時間伺服器

可以選擇叢集中某個節點作為時間伺服器,NTP服務只需要很少的系統資源。假設選擇zhh1作為時間伺服器,zhh2向它同步:

編輯zhh1ntp配置檔案

server 127.127.1.0          #注意不是127.0.0.1 

fudge  127.127.1.0 stratum 11 

driftfile /var/lib/ntp/drift broadcastdelay 0.008

然後編輯zhh2ntp配置檔案

server 192.168.5.235 prefer 

driftfile /var/lib/ntp/drift 

broadcastdelay 0.008

3)啟動ntp服務,並設定開機啟動

[root@zhh1 ~]# /etc/init.d/ntpd start

[root@zhh1 ~]# chkconfig ntpd on

 

2配置hangcheck-timer模組

9.2以前使用一個名為watchdogd的使用者空間監視後臺程式來監視叢集的狀態情況,並在出現故障時重新啟動RAC節點。從Oracle9.2.0.2開始,此監視後臺程式已被名為hangcheck-timer的模組所代替,該模組可以更好地解決可用性和可靠性問題。hang-check計時器被載入到Linux核心中並檢查系統是否掛起。它將設定一個計時器,並在特定的時間量之後檢查該計時器。有一個用於檢查掛起情況的可配置閾值,如果超過該閾值,計算機將重新啟動。儘管Oracle CRS並不需要hangcheck-timer模組,但Oracle強烈建議使用它

hangcheck-timer模組使用了一個基於核心的計時器,該計時器週期性地檢查系統任務排程程式,以捕獲延遲,從而確定系統的執行狀況。如果系統掛起或暫停,則計時器重置該節點。hangcheck-timer模組使用時間戳計數器(TSC) CPU暫存器,該暫存器在每個時鐘訊號處遞增。由於此暫存器由硬體自動更新,因此TCS提供了更精確的時間度量。

兩個引數,即hangcheck_tick(定義系統檢查頻率,預設60soracle建議30s)和hangcheck_margin(定義在重置RAC節點前的最大掛起延時,預設180soracle建議180s)來確定節點是否出現故障。hangcheck-timer模組會根據hangcheck_tick的設定,定時檢查核心。只要響應時間小於hangcheck_tick+hangcheck_margin,都會認為核心執行正常。否則,就意味著執行異常,模組會自動重啟系統。

 

注意:crs的引數MissCount必須大於hangcheck_tick+hangcheck_margin的和(需考證)

miscount的值用crsctl get css misscount查詢,10gR2 linux平臺,預設60s

 

設定hangcheck核心模組引數:

vi /etc/modprobe.conf

options hangcheck-timer hangcheck_tick=30 hangcheck_margin=180

設定hangcheck核心模組開機載入

vi /etc/rc.d/rc.local

/sbin/modprobe hangcheck-timer

 

要立即載入模組,執行:

modprobe -v hangcheck-timer

檢查載入情況:

[root@zhh1 ~]# lsmod | grep hangcheck_timer

hangcheck_timer        5593 0


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/751371/viewspace-710828/,如需轉載,請註明出處,否則將追究法律責任。

相關文章