某資料庫的節點4因網路問題,主機關閉
某資料庫的節點4因網路問題,主機關閉。
主機重啟後,客戶啟動crs後,發現crs啟動hang住。
# sh -x /etc/init.cssd startcheck
+ ORA_CRS_HOME=/oracle/product/10.2.0/crs
+ ORACLE_USER=oracle
+ ORACLE_HOME=/oracle/product/10.2.0/crs
+ export ORACLE_HOME
+ export ORA_CRS_HOME
+ export ORACLE_USER
+ DISABLE_OPROCD=false
+ OPROCD_DEFAULT_TIMEOUT=1000
+ OPROCD_DEFAULT_MARGIN=500
+ OPROCD_CHECK_TIMEOUT=2000
+ OPROCD_STOP_TIMEOUT=2000
+ OPROCD_DEFAULT_HISTORGRAM=
+ HOSTN=/bin/hostname
+ EXPRN=/usr/bin/expr
+ CUT=/usr/bin/cut
+ AWK=/bin/awk
+ ECHO=echo
+ TR=/bin/tr
+ /bin/uname
+ [ SunOS = AIX ]
+ /bin/uname
+ [ Linux = AIX ]
+ + /bin/hostname
HOST=sgdb2
+ + /usr/bin/expr sgdb2 : .*
len1=5
+ + /usr/bin/expr match sgdb2 [0-9]*\.[0-9]*\.[0-9]*\.[0-9]*
len2=0
+ [ 5 != 0 ]
+ + echo sgdb2
+ /usr/bin/cut -d. -f1
HOST=sgdb2
+ + /bin/tr [:upper:] [:lower:]
+ echo sgdb2
HOST=sgdb2
+ PS=/bin/ps
+ PSE=/bin/ps -e
+ PSEF=/bin/ps -ef
+ HEAD=/bin/head
+ GREP=/bin/grep
+ KILL=/bin/kill
+ KILLTERM=/bin/kill -TERM
+ KILLDIE=/bin/kill -9
+ KILLCHECK=/bin/kill -0 6357102
+ SLEEP=/bin/sleep
+ NULL=/dev/null
+ UNAME=/bin/uname
+ CAT=/bin/cat
+ RMF=/bin/rm -f
+ TEST=/bin/test
+ WCL=/bin/wc -l
+ TOUCH=/bin/touch
+ SU=/bin/su
+ SED=/bin/sed
+ RENICE=/bin/renice
+ RTGPID=/bin/priocntl -s -c RT -i pgid
+ XARGS=/bin/xargs
+ PWD_COMMAND=/usr/bin/pwd
+ MVF=/bin/mv -f
+ EVAL=eval
+ LS=/bin/ls
+ BASENAME=/bin/basename
+ DATE=/bin/date
+ MKDIRP=/bin/mkdir -p
+ CHOWN=/bin/chown
+ CHMOD=/bin/chmod
+ SYNC=/bin/sync
+ USING_VC=0
+ OMONSLEEP=
+ SYNCSLEEP=0
+ + /bin/date +%Y-%m-%d-%H:%M:%S
UNIQUEDATE=2013-12-16-11:45:09
+ UNIQUECORE=core.2013-12-16-11:45:09
+ FINDCLSVMON=/bin/ps -e -o comm,pid | /bin/grep '^oclsvmon'
+ FINDCLSOMON=/bin/ps -e -o comm,pid | /bin/grep '^oclsomon'
+ FINDCSSD=/bin/ps -e -o comm,pid | /bin/grep '^ocssd'
+ FINDPROCD=/bin/ps -e -o comm,pid | /bin/grep '^oprocd'
+ LOGERR=/bin/logger -puser.alert
+ LOGMSG=/bin/logger -puser.err
+ CLEANREBOOTLOCK=/bin/true
+ OPROCD=/oracle/product/10.2.0/crs/bin/oprocd
+ CRSCTL=/oracle/product/10.2.0/crs/bin/crsctl
......
+ /etc/init.cssd runcheck
+ STATUS=0
+ [ 0 != 0 ]
+ [ 0 -eq 1 ]
+ [ ! -r /oracle/product/10.2.0/crs/bin/crsctl ]
+ [ = CSS ]
+ /bin/su oracle -c /oracle/product/10.2.0/crs/bin/crsctl check boot > /tmp/crsctl.6357102
+ RC=8
+ [ 8 != 0 ]
+ /bin/logger -puser.err Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.6357102.
+ /bin/sleep 60
+ /bin/su oracle -c /oracle/product/10.2.0/crs/bin/crsctl check boot > /tmp/crsctl.6357102
+ RC=8
+ [ 8 != 0 ]
+ /bin/logger -puser.err Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.6357102.
+ /bin/sleep 60
+ /bin/su oracle -c /oracle/product/10.2.0/crs/bin/crsctl check boot > /tmp/crsctl.6357102
+ RC=8
+ [ 8 != 0 ]
+ /bin/logger -puser.err Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.6357102.
+ /bin/sleep 60
Broadcast message from root@sgdb2 (tty) at 11:47:24 ...
Starting Concurrent Logical Volume Manager (gsclvmd) subsystem on sgdb2
Broadcast message from root@sgdb2 (tty) at 11:47:25 ...
Starting Cluster Information Services (clinfoES) subsystem on sgdb2
+ /bin/su oracle -c /oracle/product/10.2.0/crs/bin/crsctl check boot > /tmp/crsctl.6357102
+ RC=0
+ [ 0 != 0 ]
+ /bin/logger -puser.err Cluster Ready Services completed waiting on dependencies.
+ /bin/rm -f /tmp/crsctl.6357102
+ /bin/sleep 0
+ exit 0
檢視錯誤資訊
#cat /tmp/crsctl.6357102
OCR initialization failed accessing OCR device: PROC-26: Error while accessing the physical storage Operating System error [No such device or address] [6]
HA檢視
# lssrc -g cluster
Subsystem Group PID Status
clstrmgrES cluster 5374026 active
應該是因為該節點的HA沒起導致的ocr讀取失敗,從而是crs狀態異常。
拉起HA後,然後拉起CRS。最後拉庫的時候一直停留在
alter database open; 有1小時
後臺日誌沒有報錯。
以前也出現過這種情況,是出現enq:TT鎖阻塞了。
column event format a30
column sess format a20
set linesize 150
break on id1 skip 1
select decode(request,0,'Holder:',' Waiter:') || s.inst_id || ':' || s.sid||','|| s.serial# sess,
id1, id2, lmode, request, l.type, ctime, s.sql_id, s.event,s.last_call_et
-- ,s.service_name
from gv$lock l, gv$session s
where (id1, id2, l.type) in
(select id1, id2, type from gv$lock where request>0
)
and l.sid=s.sid
and l.inst_id=s.inst_id
order by id1, ctime desc, request
/
SESS ID1 ID2 LMODE REQUEST TY CTIME SQL_ID EVENT LAST_CALL_ET
-------------------- ---------- ---------- ---------- ---------- -- ---------- ------------- ------------------------------ ------------
Holder:1:1770,3730 0 0 4 0 TT 2324808 SQL*Net message from client 1458937
Waiter:4:2265,1 0 0 6 TT 2581 a01hp0psv0rrh enq: TT - contention 2587
Waiter:1:2209,1 0 0 4 TT 2426 4gd6b1r53yt88 enq: TT - contention 3438988
Waiter:3:2280,1 0 0 4 TT 2349 4gd6b1r53yt88 enq: TT - contention 5709961
Waiter:2:2209,1 0 0 4 TT 2234 4gd6b1r53yt88 enq: TT - contention 5193911
可以看到sid為1770 的程式將羨慕幾個都給阻塞了。
接著找1770對應的spid
col username format a10
col program format a10
col event format a23
col spid format a10
col machine format a20
col blocking_session format 99999
set linesize 500
set pagesize 1000
select s.sid,s.serial#,s.username,s.machine,p.spid,s.program,s.sql_id,s.event,s.last_call_et,s.blocking_session
from v$session s,v$process p
where
p.addr=s.paddr and s.sid=1770 order by last_call_et desc;
SID SERIAL# USERNAME MACHINE SPID PROGRAM SQL_ID EVENT LAST_CALL_ET BLOCKING_SESSION
---------- ---------- ---------- -------------------- ---------- ---------- ------------- ----------------------- ------------ ----------------
1770 3730 DWOUWENMIN SWG\NOAS-MET1-3650 757908 PlSqlDev.e SQL*Net message from cl 1458865
xe ient
kill -9 757908 後 庫open了
中間還試過debug,無結果。oracle debug的方法:
SQL> oradebug setmypid;
Statement processed.
SQL> oradebug unlimit;
Statement processed.
SQL> oradebug -g all hanganalyze 3;
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/24996904/viewspace-1063536/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 資料庫連線未關閉的問題資料庫
- 資料庫——查詢樹形結構某節點的所有子節點、所有父節點資料庫
- 資料庫關閉的學問 (轉)資料庫
- 【RAC】因系統時間設定不當,造成RAC一節點叢集資源及資料庫關閉資料庫
- 關於資料庫表記錄主鍵生成的問題?資料庫
- 關於網路的一點問題(轉)
- 關閉某個網路卡
- 關於資料庫 Block 儲存細節問題的討論資料庫BloC
- 資料庫關閉資料庫
- MySQL資料庫診斷:InnoDB關機問題MySql資料庫
- 某新裝業務1庫節點2啟動關閉資料庫很慢且sqlplus連線也很慢故障分析處理資料庫SQL
- 資料庫主機重啟卡住問題處理分享資料庫
- 資料庫關聯問題資料庫
- RAC 資料庫節點間的關係及資源管理資料庫
- 【分享】資料庫的熱點塊問題資料庫
- 3.3.1 關於關閉資料庫資料庫
- 資料庫事物相關問題資料庫
- 重起oracle rac三節點中rac02主機以解決鏈路noname問題Oracle
- ORA-01034,修改主機名導致的資料庫問題資料庫
- 請問,關於資料庫連線的問題。資料庫
- RAC資料庫的RMAN備份異機恢復到單節點資料庫資料庫
- 關於資料庫中儲存中文的問題,請高手指點資料庫
- 電網會否因網路問題而異常?
- 安全關閉Oracle資料庫Oracle資料庫
- 網路資料庫練習題資料庫
- 基於4個節點的corosync + pacemaker PG 資料庫 HA 配置ROS資料庫
- oracle資料庫的關閉過程Oracle資料庫
- 深度分析資料庫的熱點塊問題資料庫
- 一次心跳網路問題導致的節點新增失敗
- Basic4Android主執行緒連線網路MySQL資料庫的方法Android執行緒MySql資料庫
- 資料庫自增主鍵可能產生的問題資料庫
- 一個資料庫要關注的問題資料庫
- 關於資料庫和jdbc的問題,指教資料庫JDBC
- 關於資料庫緩衝池的問題資料庫
- oracle資料庫網路相關的若干概念Oracle資料庫
- 允許區域網內其他主機訪問本地MySql資料庫MySql資料庫
- 蘋果手機使用技巧:iPhone6如何關閉4G網路?蘋果iPhone
- oracle兩節點RAC,由於gipc導致某節點crs無法啟動問題分析Oracle