某資料庫的節點4因網路問題,主機關閉
某資料庫的節點4因網路問題,主機關閉。
主機重啟後,客戶啟動crs後,發現crs啟動hang住。
# sh -x /etc/init.cssd startcheck
+ ORA_CRS_HOME=/oracle/product/10.2.0/crs
+ ORACLE_USER=oracle
+ ORACLE_HOME=/oracle/product/10.2.0/crs
+ export ORACLE_HOME
+ export ORA_CRS_HOME
+ export ORACLE_USER
+ DISABLE_OPROCD=false
+ OPROCD_DEFAULT_TIMEOUT=1000
+ OPROCD_DEFAULT_MARGIN=500
+ OPROCD_CHECK_TIMEOUT=2000
+ OPROCD_STOP_TIMEOUT=2000
+ OPROCD_DEFAULT_HISTORGRAM=
+ HOSTN=/bin/hostname
+ EXPRN=/usr/bin/expr
+ CUT=/usr/bin/cut
+ AWK=/bin/awk
+ ECHO=echo
+ TR=/bin/tr
+ /bin/uname
+ [ SunOS = AIX ]
+ /bin/uname
+ [ Linux = AIX ]
+ + /bin/hostname
HOST=sgdb2
+ + /usr/bin/expr sgdb2 : .*
len1=5
+ + /usr/bin/expr match sgdb2 [0-9]*\.[0-9]*\.[0-9]*\.[0-9]*
len2=0
+ [ 5 != 0 ]
+ + echo sgdb2
+ /usr/bin/cut -d. -f1
HOST=sgdb2
+ + /bin/tr [:upper:] [:lower:]
+ echo sgdb2
HOST=sgdb2
+ PS=/bin/ps
+ PSE=/bin/ps -e
+ PSEF=/bin/ps -ef
+ HEAD=/bin/head
+ GREP=/bin/grep
+ KILL=/bin/kill
+ KILLTERM=/bin/kill -TERM
+ KILLDIE=/bin/kill -9
+ KILLCHECK=/bin/kill -0 6357102
+ SLEEP=/bin/sleep
+ NULL=/dev/null
+ UNAME=/bin/uname
+ CAT=/bin/cat
+ RMF=/bin/rm -f
+ TEST=/bin/test
+ WCL=/bin/wc -l
+ TOUCH=/bin/touch
+ SU=/bin/su
+ SED=/bin/sed
+ RENICE=/bin/renice
+ RTGPID=/bin/priocntl -s -c RT -i pgid
+ XARGS=/bin/xargs
+ PWD_COMMAND=/usr/bin/pwd
+ MVF=/bin/mv -f
+ EVAL=eval
+ LS=/bin/ls
+ BASENAME=/bin/basename
+ DATE=/bin/date
+ MKDIRP=/bin/mkdir -p
+ CHOWN=/bin/chown
+ CHMOD=/bin/chmod
+ SYNC=/bin/sync
+ USING_VC=0
+ OMONSLEEP=
+ SYNCSLEEP=0
+ + /bin/date +%Y-%m-%d-%H:%M:%S
UNIQUEDATE=2013-12-16-11:45:09
+ UNIQUECORE=core.2013-12-16-11:45:09
+ FINDCLSVMON=/bin/ps -e -o comm,pid | /bin/grep '^oclsvmon'
+ FINDCLSOMON=/bin/ps -e -o comm,pid | /bin/grep '^oclsomon'
+ FINDCSSD=/bin/ps -e -o comm,pid | /bin/grep '^ocssd'
+ FINDPROCD=/bin/ps -e -o comm,pid | /bin/grep '^oprocd'
+ LOGERR=/bin/logger -puser.alert
+ LOGMSG=/bin/logger -puser.err
+ CLEANREBOOTLOCK=/bin/true
+ OPROCD=/oracle/product/10.2.0/crs/bin/oprocd
+ CRSCTL=/oracle/product/10.2.0/crs/bin/crsctl
......
+ /etc/init.cssd runcheck
+ STATUS=0
+ [ 0 != 0 ]
+ [ 0 -eq 1 ]
+ [ ! -r /oracle/product/10.2.0/crs/bin/crsctl ]
+ [ = CSS ]
+ /bin/su oracle -c /oracle/product/10.2.0/crs/bin/crsctl check boot > /tmp/crsctl.6357102
+ RC=8
+ [ 8 != 0 ]
+ /bin/logger -puser.err Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.6357102.
+ /bin/sleep 60
+ /bin/su oracle -c /oracle/product/10.2.0/crs/bin/crsctl check boot > /tmp/crsctl.6357102
+ RC=8
+ [ 8 != 0 ]
+ /bin/logger -puser.err Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.6357102.
+ /bin/sleep 60
+ /bin/su oracle -c /oracle/product/10.2.0/crs/bin/crsctl check boot > /tmp/crsctl.6357102
+ RC=8
+ [ 8 != 0 ]
+ /bin/logger -puser.err Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.6357102.
+ /bin/sleep 60
Broadcast message from root@sgdb2 (tty) at 11:47:24 ...
Starting Concurrent Logical Volume Manager (gsclvmd) subsystem on sgdb2
Broadcast message from root@sgdb2 (tty) at 11:47:25 ...
Starting Cluster Information Services (clinfoES) subsystem on sgdb2
+ /bin/su oracle -c /oracle/product/10.2.0/crs/bin/crsctl check boot > /tmp/crsctl.6357102
+ RC=0
+ [ 0 != 0 ]
+ /bin/logger -puser.err Cluster Ready Services completed waiting on dependencies.
+ /bin/rm -f /tmp/crsctl.6357102
+ /bin/sleep 0
+ exit 0
檢視錯誤資訊
#cat /tmp/crsctl.6357102
OCR initialization failed accessing OCR device: PROC-26: Error while accessing the physical storage Operating System error [No such device or address] [6]
HA檢視
# lssrc -g cluster
Subsystem Group PID Status
clstrmgrES cluster 5374026 active
應該是因為該節點的HA沒起導致的ocr讀取失敗,從而是crs狀態異常。
拉起HA後,然後拉起CRS。最後拉庫的時候一直停留在
alter database open; 有1小時
後臺日誌沒有報錯。
以前也出現過這種情況,是出現enq:TT鎖阻塞了。
column event format a30
column sess format a20
set linesize 150
break on id1 skip 1
select decode(request,0,'Holder:',' Waiter:') || s.inst_id || ':' || s.sid||','|| s.serial# sess,
id1, id2, lmode, request, l.type, ctime, s.sql_id, s.event,s.last_call_et
-- ,s.service_name
from gv$lock l, gv$session s
where (id1, id2, l.type) in
(select id1, id2, type from gv$lock where request>0
)
and l.sid=s.sid
and l.inst_id=s.inst_id
order by id1, ctime desc, request
/
SESS ID1 ID2 LMODE REQUEST TY CTIME SQL_ID EVENT LAST_CALL_ET
-------------------- ---------- ---------- ---------- ---------- -- ---------- ------------- ------------------------------ ------------
Holder:1:1770,3730 0 0 4 0 TT 2324808 SQL*Net message from client 1458937
Waiter:4:2265,1 0 0 6 TT 2581 a01hp0psv0rrh enq: TT - contention 2587
Waiter:1:2209,1 0 0 4 TT 2426 4gd6b1r53yt88 enq: TT - contention 3438988
Waiter:3:2280,1 0 0 4 TT 2349 4gd6b1r53yt88 enq: TT - contention 5709961
Waiter:2:2209,1 0 0 4 TT 2234 4gd6b1r53yt88 enq: TT - contention 5193911
可以看到sid為1770 的程式將羨慕幾個都給阻塞了。
接著找1770對應的spid
col username format a10
col program format a10
col event format a23
col spid format a10
col machine format a20
col blocking_session format 99999
set linesize 500
set pagesize 1000
select s.sid,s.serial#,s.username,s.machine,p.spid,s.program,s.sql_id,s.event,s.last_call_et,s.blocking_session
from v$session s,v$process p
where
p.addr=s.paddr and s.sid=1770 order by last_call_et desc;
SID SERIAL# USERNAME MACHINE SPID PROGRAM SQL_ID EVENT LAST_CALL_ET BLOCKING_SESSION
---------- ---------- ---------- -------------------- ---------- ---------- ------------- ----------------------- ------------ ----------------
1770 3730 DWOUWENMIN SWG\NOAS-MET1-3650 757908 PlSqlDev.e SQL*Net message from cl 1458865
xe ient
kill -9 757908 後 庫open了
中間還試過debug,無結果。oracle debug的方法:
SQL> oradebug setmypid;
Statement processed.
SQL> oradebug unlimit;
Statement processed.
SQL> oradebug -g all hanganalyze 3;
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/24996904/viewspace-1063536/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 資料庫——查詢樹形結構某節點的所有子節點、所有父節點資料庫
- 資料庫主機重啟卡住問題處理分享資料庫
- 資料庫事物相關問題資料庫
- 3.3.1 關於關閉資料庫資料庫
- [20200309]資料庫異常關閉恢復的終點.txt資料庫
- Basic4Android主執行緒連線網路MySQL資料庫的方法Android執行緒MySql資料庫
- 允許區域網內其他主機訪問本地MySql資料庫MySql資料庫
- 深度分析資料庫的熱點塊問題(轉)資料庫
- mongodb關閉資料庫例項MongoDB資料庫
- 關於oracle資料庫訊號量的問題Oracle資料庫
- 虛擬主機資料庫與空間關係資料庫
- oracle兩節點RAC,由於gipc導致某節點crs無法啟動問題分析Oracle
- 計算機網路再次整理————tcp的關閉[七]計算機網路TCP
- mongo資料庫單節點搭建Go資料庫
- MySQL 8.0因關閉Gtid 引發從庫故障MySql
- ODPS主備叢集雙向資料複製導致主備中心網路打爆問題
- 關於 SAP HANA 資料庫的死鎖問題(deadlock)資料庫
- 3.3.3 使用immiedit模式關閉資料庫模式資料庫
- 該網站因主機過期暫時無法訪問網站
- 選購工業網路交換機值得注意的細節問題
- 關於VMware:“無法將網路更改為橋接狀態:沒有未橋接的主機網路介面卡”的問題橋接
- [20210722]資料庫異常關閉的處理.txt資料庫
- db2資料庫的啟動和關閉DB2資料庫
- 網路 保證在關閉連線前, 把資料發出去
- 電腦常見問題之:Win11的網路搜尋功能怎麼關閉?
- 對SQL Server 2014 alwayson 架構的資料庫在主節點加新的datafile檔案SQLServer架構資料庫
- MySQL - [19] 關於個人負債為主題的資料庫設計MySql資料庫
- 怎樣關閉Win10系統的網路位置_win10關閉網路位置的教程Win10
- 3節點RAC資料庫夯故障分析資料庫
- Gbase 8a資料庫節點替換資料庫
- IndexedDB 建立資料庫時使用自增的Key 更新資料庫遇到的問題的一點記錄Index資料庫
- 埋在 MYSQL 資料庫應用中的17個關鍵問題!MySql資料庫
- Oracle DB 因宿主機(Linux 虛擬機器)意外關停,重啟資料庫步驟OracleLinux虛擬機資料庫
- Oracle資料庫歸檔模式的開啟和關閉Oracle資料庫模式
- MySQL主從資料庫同步延遲問題怎麼解決MySql資料庫
- rac新增節點容易遇到的問題
- 本地連線虛擬機器資料庫問題虛擬機資料庫
- 【RAC】因硬體問題引起叢集重配可能造成所有節點不可用
- Oracle 12.2 Heavy swapping 資料庫自動關閉OracleAPP資料庫