IO錯誤與NetApp

wmlm發表於2008-07-14
問題現象:
剛上班,專案經理找我說資料庫不能連線。
這是XXX資料庫伺服器,上面有兩個例項:一個XX平臺,一個XXX.資料庫不能連線,服務電話自然就響起來了.
[@more@]

檢查:
登入到伺服器。
伺服器環境使用的是windows2003 + oracle9i單機 + NETAPP儲存,原來一直執行穩定。
檢視alert告警日誌,有以下類似內容:
Sat Jul 12 07:04:38 2008
KCF: write/open error block=0x685 online=1
file=15 E:ORACLEORADATAHTJSCGSUNDOTBS02.ORA
error=27070 txt: 'OSD-04016: Error queuing an asynchronous I/O request.
O/S-Error: (OS 1117) 由於 I/O 裝置錯誤,無法執行此項請求。'
Sat Jul 12 07:04:38 2008
Errors in file c:oracleadminhtjscgsbdumphtjscgs_dbw0_2252.trc:
ORA-01242: data file suffered media failure: database in NOARCHIVELOG mode
ORA-01114: IO error writing block to file 15 (block # 1669)
ORA-01110: data file 15: 'E:ORACLEORADATAHTJSCGSUNDOTBS02.ORA'
ORA-27070: skgfdisp: async read/write failed
OSD-04016: Error queuing an asynchronous I/O request.
O/S-Error: (OS 1117) 由於 I/O 裝置錯誤,無法執行此項請求。

DBW0: terminating instance due to error 1242
Sat Jul 12 07:09:40 2008
Errors in file c:oracleadminhtjscgsbdumphtjscgs_pmon_2184.trc:
ORA-01242: data file suffered media failure: database in ARCHIVELOG mode

看一下另外一個例項的告警日誌:
Sat Jul 12 07:29:13 2008
Errors in file c:oracleadmindxptbdumpdxpt_lgwr_2420.trc:
ORA-27103: internal error
OSD-00009: Message 9 not found; product=RDBMS; facility=SOSD
ORA-00340: IO error processing online log 2 of thread 1
ORA-00345: redo log write error block 154703 count 3
ORA-00312: online log 2 thread 1: 'G:ORACLEORADATADXPTREDO02.LOG'
ORA-27070: skgfdisp: async read/write failed
OSD-04016: Error queuing an asynchronous I/O request.
O/S-Error: (OS 1117) 由於 I/O 裝置錯誤,無法執行此項請求。

資源管理器看一下,都還健在,很奇怪!難道這兩個資料庫服務都是自動執行?看了一下服務,果然都是自動。

起因:由於機房電源問題,伺服器關機重啟了一次。而透過NetApp掛載的後兩塊硬碟的mount在資料庫啟動之後。

解決:
重啟資料庫,卻突然報了一個out of memory. NND,不成這個虛擬機器做的伺服器記憶體丟了?看了一下,2G記憶體也健在。
再透過工作管理員看看,也經有兩個oracle.exe,佔據了大量記憶體。
透過服務停掉兩個例項,透過CMD,重啟這個服務,正常啟動,問題解決。
小結:
出現問題不能妄下結論,一定要經過驗證才能確定。另外儲存的知識也要有,不然,稀哩糊塗重啟了資料庫,也搞不清楚問題根源在哪兒。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/271063/viewspace-1007237/,如需轉載,請註明出處,否則將追究法律責任。

相關文章