AIX5.3+HACMP5.3+ORACLE 10GRAC安裝報錯記錄

zhjixi1234發表於2013-08-04

AIX5.3+HACMP5.3+ORACLE 10GRAC安裝報錯記錄

 

環境:AIX 5312 + HACMP5.3+ORACLE10.2.0.4

1.       問題1:在安裝CRS時,第一個節點執行root.sh的時候,卡在

Startup will be queued to init within 30 seconds.

 

root.sh執行過程如下:

root@ykcs1:[/oracle/app/crs]#sh root.sh

WARNING: directory '/oracle/app' is not owned by root

WARNING: directory '/oracle' is not owned by root

Checking to see if Oracle CRS stack is already configured

Checking to see if any 9i GSD is up

 

Setting the permissions on OCR backup directory

Setting up NS directories

Oracle Cluster Registry configuration upgraded successfully

WARNING: directory '/oracle/app' is not owned by root

WARNING: directory '/oracle' is not owned by root

Successfully accumulated necessary OCR keys.

Using ports: CSS=49895 CRS=49896 EVMC=49898 and EVMR=49897.

node   

node 1: ykcs1 ykcs1-pri ykcs1

node 2: ykcs2 ykcs2-pri ykcs2

Creating OCR keys for user 'root', privgrp 'system'..

Operation successful.

Now formatting voting device: /dev/rzvote_512m

Format of 1 voting devices complete.

Startup will be queued to init within 30 seconds.

 

經排查,是在配置CRS IP的時候,修改了主機hosts檔案未重啟,導致。

 

2.       問題2:安裝CRS卡在

Expecting the CRS daemons to be up within 600 seconds.

10分鐘後報錯如下:

Failure at final check of Oracle CRS stack.

10

 

由於第一次接觸10G RAC排錯不是很拿手,試過網上很多方法如許可權、共享磁碟、清理/var/tmp/.oracle等方式,均沒有效果。最後在同事的指導下,檢視程式發現CSSD程式啟動失敗,後臺LOG如下:

oracle@ykcs1_/oracle/app/crs/log/ykcs1/cssd$ more ocssd.log

Oracle Database 10g CRS Release 10.2.0.1.0 Production Copyright 1996, 2005 Oracle.  All rights reserved.

[CSSD]2013-08-05 10:06:06.826 >USER:    Oracle Database 10g CSS Release 10.2.0.1.0 Production Copyright 1996, 2004 Oracle.  All rights reserved.

[CSSD]2013-08-05 10:06:06.826 >USER:    CSS daemon log for node ykcs1, number 1, in cluster crs

[  clsdmt]Listening to (ADDRESS=(PROTOCOL=ipc)(KEY=ykcs1DBG_CSSD))

[CSSD]2013-08-05 10:06:06.915 [1] >TRACE:clssscmain: local-only set to false

[CSSD]2013-08-05 10:06:07.063 [1] >TRACE:clssnmReadNodeInfo: added node 1 (ykcs1) to cluster

[CSSD]2013-08-05 10:06:07.075 [1] >TRACE:clssnmReadNodeInfo: added node 2 (ykcs2) to cluster

[CSSD]2013-08-05 10:06:07.173 [1029] >TRACE:clssnm_skgxninit: initialized skgxn version (2/0/IBM AIX skgxn)

[CSSD]2013-08-05 10:06:07.358 [1029] >ERROR:clssnm_skgxnmon: Failure 0 registering.(1/1 [HA_GS_NOT_OK]/sskgxn_gs_in)

[CSSD]2013-08-05 10:06:07.360 [1] >TRACE:clssnmInitNMInfo: misscount set to 600

[CSSD]2013-08-05 10:06:07.365 [1] >TRACE:clssnmDiskStateChange: state from 1 to 2 disk (0//dev/rzvote_512m)

[CSSD]2013-08-05 10:06:09.389 [1030] >TRACE:clssnmDiskStateChange: state from 2 to 4 disk (0//dev/rzvote_512m)

[CSSD]2013-08-05 10:06:09.472 [1] >TRACE:clssscSclsFatal: read value of disable

[CSSD]2013-08-05 10:06:09.472 [1544] >TRACE:clssnmFatalThread: spawned

[CSSD]2013-08-05 10:06:09.472 [1] >TRACE:clssscSclsFatal: read value of disable

[CSSD]2013-08-05 10:06:09.472 [1801] >TRACE:clssnmconnect: connecting to node 1, flags 0x0001, connector 1

[CSSD]2013-08-05 10:06:09.528 [2058] >TRACE:   clssgmclientlsnr: listening on (ADDRESS=(PROTOCOL=ipc)(KEY=Oracle_CSS_LclLstnr_crs_1))

[CSSD]2013-08-05 10:06:09.528 [2058] >TRACE:   clssgmclientlsnr: listening on (ADDRESS=(PROTOCOL=ipc)(KEY=OCSSD_LL_ykcs1_crs))

[CSSD]2013-08-05 10:06:09.549 [3600] >TRACE:clssnmRcfgMgrThread: Connection complete

[CSSD]2013-08-05 10:06:09.549 [3086] >TRACE:clssnmPollingThread: Connection complete

[CSSD]2013-08-05 10:06:09.549 [3343] >TRACE:clssnmSendingThread: Connection complete

[CSSD]2013-08-05 10:06:09.549 [3600] >TRACE:clssnmRcfgMgrThread: Local Join

[CSSD]2013-08-05 10:06:09.549 [3600] >TRACE:clssnmDoSyncUpdate: Initiating sync 1

[CSSD]2013-08-05 10:06:09.549 [3600] >TRACE:clssnmSetupAckWait: Ack message type (11) 

[CSSD]2013-08-05 10:06:09.549 [3600] >TRACE:clssnmSetupAckWait: node(1) is ALIVE

[CSSD]2013-08-05 10:06:09.549 [3600] >TRACE:clssnmSendSync: syncSeqNo(1)

[CSSD]2013-08-05 10:06:09.549 [1801] >TRACE:clssnmHandleSync: Acknowledging sync: src[1] srcName[ykcs1] seq[1] sync[1]

[CSSD]2013-08-05 10:06:09.550 [3600] >TRACE:clssnmWaitForAcks: Ack message type(11), ackCount(1)

[CSSD]2013-08-05 10:06:09.649 [1] >USER:    NMEVENT_SUSPEND [00][00][00][00]

[CSSD]2013-08-05 10:06:10.550 [3600] >TRACE:clssnmWaitForAcks: done, msg type(11)

[CSSD]2013-08-05 10:06:10.550 [3600] >TRACE:clssnmSetupAckWait: Ack message type (13) 

[CSSD]2013-08-05 10:06:10.550 [3600] >TRACE:clssnmSetupAckWait: node(1) is ACTIVE

[CSSD]2013-08-05 10:06:10.550 [3600] >TRACE:clssnmSendVote: syncSeqNo(1)

[CSSD]2013-08-05 10:06:10.550 [3600] >TRACE:clssnmWaitForAcks: Ack message type(13), ackCount(1)

[CSSD]2013-08-05 10:06:10.550 [1801] >TRACE:clssnmSendVoteInfo: node(1) syncSeqNo(1)

[CSSD]2013-08-05 10:06:11.550 [3600] >TRACE:clssnmWaitForAcks: done, msg type(13)

[CSSD]2013-08-05 10:06:11.550 [3600] >TRACE:clssnmCheckDskInfo: Checking disk info...

[CSSD]2013-08-05 10:06:12.550 [3600] >ERROR:clssnmCheckDskInfo: We appear to be dead skgxn 0

[CSSD]2013-08-05 10:06:12.550 [3600] >ERROR:clssnmDoSyncUpdate:  checkDskInfo signaled shutdown

[CSSD]2013-08-05 10:06:12.550 [3600] >TRACE:clssscctx:  dump of 0x11000ddf0, len 3752

[CSSD]2013-08-05 10:06:12.550 [3600] >TRACE:   0x11000ddf0 00 00 00 01 10 9a 08 b0 - 00 00 00 01 10 95 6e 50 ..............nP

[CSSD]2013-08-05 10:06:12.550 [3600] >TRACE:   0x11000de00 00 00 00 00 00 00 00 00 - 00 00 00 01 10 00 d9 d0 ................

[CSSD]2013-08-05 10:06:12.550 [3600] >TRACE:   0x11000de10 00 00 00 01 10 01 74 f0 - 00 00 00 01 10 00 ec b0 ......t.........

[CSSD]2013-08-05 10:06:12.550 [3600] >TRACE:   0x11000de20 00 00 00 70 00 00 00 00 - 00 00 00 01 10 00 dd f0 ...p............

[CSSD]2013-08-05 10:06:12.550 [3600] >TRACE:   0x11000de30 00 00 00 00 00 00 00 00 - 00 00 00 00 00 00 00 00 ................

ocssd.log (0%)

 

確定為HA的問題,搜尋HA_GS_NOT_OK問題後確定為oracle未加進使用者組hagsuser

oracle加入hagsuser組之後CRS建立正常。

 

3.       配置VIP後,安裝完資料庫軟體後,配置監聽,配置監聽第2節點監聽服務無法啟動,netstat -in檢視VIP發現vip2個均在1號節點上。

排查原因為,安裝系統時,由於2號節點配置的問en1,en2網路卡,en0網路卡無法使用,1號節點配置的en0,en1網路卡,配置VIP後,由於2號節點en0無法使用,節點的VIP飄到1號節點上。

 

最後只能重新配置AIX 虛擬機器的網路卡。以後保證安裝的兩臺機器IP對應網路卡名稱一致。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/26739940/viewspace-767746/,如需轉載,請註明出處,否則將追究法律責任。

相關文章