【故障處理】RAC環境第二節點無法歸檔的詭異問題處理

secooler發表於2010-04-12
成功處理了一起RAC第二節點無法歸檔的詭異問題。總結在此。

RAC第二節點的alert警告檔案中大量充斥著如下的報錯資訊。
Fri Jan 29 09:37:23 2010
Errors in file /oracle/app/oracle/admin/gkdb/bdump/gkdb2_arc1_671818.trc:
ORA-19502: write error on file "/archive/2_19_705990330.dbf", blockno 188417 (blocksize=512)
ORA-27063: number of bytes read/written is incorrect
IBM AIX RISC System/6000 Error: 28: No space left on device
Additional information: -1
Additional information: 1048576
ORA-19502: write error on file "/archive/2_19_705990330.dbf", blockno 188417 (blocksize=512)


Tue Mar 30 12:20:46 2010
Errors in file /oracle/app/oracle/admin/gkdb/bdump/gkdb2_arc1_1020072.trc:
ORA-16038: log 4 sequence# 76 cannot be archived
ORA-19504: failed to create file ""
ORA-00312: online log 4 thread 2: '/dev/rredo_4'

第一直覺就是歸檔目錄下的空間不足或者許可權不對。但是,此次卻非所願。

此次詭異現象的的真實原因:
RAC兩個節點都掛載了一個jfs2格式的/archive目錄(這是一個儲存層面遺留的問題),這樣導致只有以第一個節點可以完成歸檔日誌向/archive目錄下寫入,但是在這種配置模式下第二個節點是無法向/archive目錄寫入歸檔日誌。
這就是導致這次第二個節點無法完成歸檔的真實原因。

處理方法:
第一種處理方法:將RAC資料庫的歸檔模式調整為非歸檔模式;
第二種處理方法:將RAC資料庫兩個節點的歸檔目錄分別分配一個共享陣列的目錄。

小結
在排查故障的過程中要綜合考慮各方原因,不要拘泥於資料庫本身,DBA需要全方面的技能。

Good luck.

secooler
10.04.12

-- The End --

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/519536/viewspace-659560/,如需轉載,請註明出處,否則將追究法律責任。

相關文章