11.2RAC環境中的CRSD程式

shilei1發表於2011-08-01


11.2中,CRSD程式不再是RAC中最關鍵的程式之一。


如果對10g RAC比較熟悉,應該清楚CRSD程式的重要性,Oracle在作業系統啟動後,就是透過啟動這個程式然後啟動整個CLUSTER以及資料庫的。

11.2RAC中,Oracle調整了ASM,使得OCRVOT可以儲存在ASM磁碟組中。ASMCLUSTER所支援的一個元件,而CLUSTER啟動所需的OCRVOT卻要放在ASM中,這其實要解決一個先有雞還是先有蛋的問題。最終Oracle透過OHASD程式的方式解決了這個問題,而整個CLUSTERASM的架構也發生了重大的變化,OHASD程式取代了CRSD程式變成了RAC環境中最關鍵的程式。

CRSD程式的重要性已經低到難以置信的地步,前兩天在一個客戶的11.2 RAC環境中發現,即使一個節點的CRSD程式沒有啟動,仍然可以手工啟動資料庫,且資料庫可以正常訪問。

導致的問題原因應該是節點2上訪問OCRVOT所在的磁碟組出現了錯誤,導致CRSD在多次嘗試獲取OCR中儲存的資訊失敗後自動退出,從而使得節點2無法正常的啟動。不過這時節點2上除了CRSD程式外,其他的CLUSTER程式已經完全啟動,ASM例項也可以啟動,這時可以手工啟動節點2上的資料庫。

節點2ASMalert有如下的錯誤資訊:

Tue Jan 18 14:09:18 2011
NOTE: client +ASM2:+ASM registered, osid 13113, mbr 0x0
Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13108.trc:
ORA-15180: could not open dynamic library ASM Library - Generic Linux, version 2.0.4 (KABI_V2), error [open]
ERROR: error ORA-15180 caught in ASM I/O path
Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13108.trc:
ORA-15081: failed to submit an I/O operation to a disk
WARNING: failed to online diskgroup resource ora.DATADG.dg (unable to communicate with CRSD/OHASD)
Tue Jan 18 14:09:19 2011
NOTE: [crsd.bin@findb2 (TNS V1-V3) 13121] opening OCR file
Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13130.trc:
ORA-15180: could not open dynamic library ASM Library - Generic Linux, version 2.0.4 (KABI_V2), error [open]
ERROR: error ORA-15180 caught in ASM I/O path
Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13130.trc:
ORA-15081: failed to submit an I/O operation to a disk
Tue Jan 18 14:09:20 2011
WARNING: failed to online diskgroup resource ora.FRADG.dg (unable to communicate with CRSD/OHASD)
Tue Jan 18 14:09:21 2011
NOTE: [crsd.bin@findb2 (TNS V1-V3) 13134] opening OCR file
Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13143.trc:
ORA-15180: could not open dynamic library ASM Library - Generic Linux, version 2.0.4 (KABI_V2), error [open]
ERROR: error ORA-15180 caught in ASM I/O path
Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13143.trc:
ORA-15081: failed to submit an I/O operation to a disk

應該就是這個原因導致ocrd程式報錯並退出。資料庫可以正常開啟,節點2上資料庫和監聽無法自動啟動,vip也存在問題。此外節點2上需要ocr資訊的工具都無法使用,比如ocrconfigocrcheck以及srvctl等。

當然一般而言,這種問題是無法接受的,這個問題最終透過重建RAC環境解決。不過這個案例也說明了10g11gCLUSTER的結構發生了多大的變化。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/196700/viewspace-703755/,如需轉載,請註明出處,否則將追究法律責任。

相關文章