Oracle RAC+DG巡檢常見問題彙總(一)

chenoracle發表於2020-08-23

問題一:

opiodr aborting process unknown ospid (18808992) as a result of ORA-609

問題分析和建議:

當任何型別的客戶端連線資料庫失敗或在連線/身份驗證過程完成之前中止連線過程時,將丟擲ORA-609錯誤。
通常,此連線中止是由於超時造成的。
從10gR2開始,連線超時的預設值設定為60秒。有時這個時間限制通常不足以完成整個連線過程。
當錯誤是間歇性時,通常並不表示存在嚴重問題。這僅僅意味著伺服器程式在整個連線過程完成之前就超時了。
可以考慮是否需要使用SQLNET.INBOUND_CONNECT_TIMEOUT延長超時時間,減少ORA-609錯誤的輸出。
如果不是因為資料本身負載高導致連線超時,可以忽略此問題。
該錯誤詳細介紹可檢視《文件 1116960.1》。

問題二:

ORA-00379: no free buffers available in buffer pool DEFAULT for block size 8K

問題分析和建議:

該問題和Bug 24838599吻合,受影響版本11.2.0.4和12.1.0.2,已在12.2.0.1版修復。
當透過alter database flashback on;方式啟動閃回時,或create restore point ..方式建立閃回點時,可能會觸發此問題。
導致啟動閃回時間延長,或啟動閃回失敗。
建議在資料庫非繁忙期執行啟動閃回操作,該錯誤詳細介紹可檢視《文件 ID 24838599.8》

問題三:

ORA-00308: cannot open archived log '/arch2/arch_218089_894737810_2.log'

問題分析和建議:

由於歸檔儲存在本地檔案系統,例項1和例項2無法讀取對方歸檔檔案,導致例項1在嘗試使用例項2歸檔進行介質恢復時,提示ORA-00308。
請檢查dg同步關係是否正常以及和同步軟體關係是否正常,如正常,可忽略此問題。

問題四:

[crfmond(8126926)]CRS-0011:An error occurred while attempting to close file "/oracle/crs/log/nebdb2/crfmond/crfmond.log" during log file rotation.

問題分析和建議:

檢視crs告警日誌顯示無法開啟crfmond.log日誌,其中crfmond.log是 Cluster Health Monitor(以下簡稱CHM)工具對應的日誌。
CHM工具用來自動收集作業系統的資源(CPU、記憶體、SWAP、程式、I/O以及網路等)的使用情況。
如果作業系統資源使用正常,可忽略此問題。

問題五:

Global Enqueue Services Deadlock detected.

問題分析和建議:

8月15日到8月19日期間產生多次死鎖問題,部分死鎖和更新tp_elec_businoticebook表有關,通常資料庫會自動回滾發起死鎖檢查的會話中對應的SQL以解決死鎖問題。
如果後續死鎖發生頻率很高,可以根據trace日誌找出具體SQL在進一步分析,如果死鎖發生頻率低,可以暫時忽略。該錯誤詳細介紹可檢視《文件 ID 1443482.1》

問題六:

ORA-16037: user requested cancel of managed recovery operation
ORA-10877: error signaled in parallel recovery slave

問題分析和建議:

該問題和Bug 19455746吻合,受影響版本11.2.0.4 RAC+ADG,已在12.2.0.1版修復。
當透過ALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL;命令取消日誌應用時,可能會出觸發此問題,並且將ORA-10877錯誤返回給執行恢復的SMON程式。
該錯誤詳細介紹可檢視《文件 ID 24838599.8》。

問題七:

ORA-16401: archive log rejected by Remote File Server (RFS)
FAL[server, ARC4]: FAL archive failed, see trace file.
ORA-16055: FAL request rejected
ARCH: FAL archive failed. Archiver continuing

問題分析和建議:

該錯誤通常出現在主庫歸檔比較頻繁時,第一個歸檔還未完成,主庫又發起第二個歸檔請求,此時備庫會檢查到歸檔gap,嘗試獲取第一個歸檔檔案,但是第一個歸檔仍未歸檔完成,就會提示此錯誤。
如只是偶發性問題,並且dg同步關係正常,可以忽略此問題。
該錯誤詳細介紹可檢視《文件 ID 1243177.1》。

問題八:

ORA-00235: control file read without a lock inconsistent due to concurrent update

問題分析和建議:

初步懷疑和BUG:12368540類似,由於效能原因,程式試圖從控制檔案中讀取資料,但沒有獲取佇列。
因此,有可能當前持有Controlfile佇列的另一個程式正在修改它,而該程式正在讀取相同的資訊。
暫時可以忽略此問題,該錯誤詳細介紹可檢視《文件 ID 1521182.1》

問題九:

sy-fund-db01[/home/oracle]$srvctl status database -d syfadb
Instance fadb1 is not running on node sy-fund-db01
Instance fadb2 is not running on node sy-fund-db02

問題分析和建議:

XXX備庫透過crsctl或srvctl檢視兩個例項狀態均未啟動,實際上例項1已經正常啟動,初步懷疑XXX備庫srvctl註冊例項後沒有啟用導致例項狀態沒更新。
如有停機視窗,可以嘗試使用srvctl工具重啟資料庫例項,再檢視例項狀態是否恢復正常。

問題十:

ORA-10458: standby database requires recovery
ORA-01194: file 1 needs more recovery to be consistent

問題分析和建議:

執行open備庫時報錯ORA-01194,懷疑備庫沒有啟動mrp恢復程式或恢復沒有完成,如果恢復完成後可以正常開啟資料庫,可忽略此問題。

問題十一:

ORA-10459: cannot start media recovery on standby database; conflicting state detected

問題分析和建議:

該錯誤通常在RAC中,其中一個例項已經啟動了MRP恢復程式,如果另一個例項嘗試啟動MRP恢復程式會出現這個錯誤。
如果檢查MRP恢復程式已經在期望的例項上執行,可以忽略此問題。
該錯誤詳細介紹可檢視《文件 ID 1938554.1》

問題十二:

ORA-00308: cannot open archived log '/arch1/2_29947_861598022.dbf'
ORA-27037: unable to obtain file status
IBM AIX RISC System/6000 Error: 2: No such file or directory

問題分析和建議:

由於歸檔儲存在本地檔案系統,例項1和例項2無法讀取對方歸檔檔案,導致例項1在嘗試使用例項2歸檔進行介質恢復時,提示ORA-00308。
請檢查dg同步關係是否正常以及R7同步關係是否正常,如正常,可忽略此問題。

歡迎關注我的微信公眾號"IT小Chen",共同學習,共同成長!!      

Oracle RAC+DG巡檢常見問題彙總(一)

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29785807/viewspace-2713986/,如需轉載,請註明出處,否則將追究法律責任。

相關文章