ORACLE RAC 11.2.0.4 for RHEL6.8無法啟動之ORA000205&ORA17503&ORA01174

清風艾艾發表於2018-12-08

    昨天,一同事諮詢,他給rac叢集的一個節點打補丁,重啟之後資料庫無法啟動,乍看情況像是磁碟組無法掛載報錯:ORA17503,仔細排查發現是db_files引數出現變更導致資料庫啟動報錯ORA01174而無法啟動。

    1、問題描述

    oracle rac 11.2.0.4 打補丁後重啟,資料庫例項無法啟動,啟動報錯data磁碟組沒有掛載如下圖所示:

    2、問題分析

    叢集節點racdb1的grid執行crsctl stat res -t -init ,檢查叢集資源程式狀態,發現正常:

     叢集節點racdb1的grid執行crsctl stat res -t  ,檢查叢集資源狀態,發現racdb1資料庫例項未掛載:

    檢視節點racdb1例項的啟動狀態為started:

    oracle使用者sys登陸資料庫執行alter database mount報錯ORA000205:

    檢查節點racdb1例項的告警日誌,告警日誌提示與1中提到的報錯一致:磁碟組data未掛載

    節點racdb1的grid使用者登入asm管理控制檯,檢查磁碟組狀態,發現data磁碟組狀態正常:

    節點racdb1的grid使用者在asm控制檯檢查控制檔案,發現能夠看到控制檔案:

    到此可以排除ASM磁碟組未掛載導致racdb1例項無法mount的。

    節點racdb1的oracle使用者首先執行shutdown abort關閉當前例項:

    節點racdb1的grid使用者使用srvctl工具啟動例項報錯ORA01174:

     到此,節點racdb1例項racdb1無法啟動原因定位到:可能是資料庫打補丁,補丁集修改了racdb1例項的資料庫引數DB_FILES引數,資料庫重啟後叢集檢查發現2個節點例項的DB_FILES引數不一致導致節點racdb1例項racdb1無法啟動。

    3、問題處理

    節點racdb1的oracle使用者登入資料庫,將例項關閉,然後啟動到nomount狀態:

    節點racdb1例項racdb1修改DB_FILES引數為500:

    因為DB_FILES為資料庫靜態引數需要重啟,關閉節點racdb1例項racdb1後,將資料庫啟動到open狀態:

   後記:事後檢查2個節點的告警日誌,除了節點racdb1的告警日誌,最後手工修改的DB_FILES引數將其設定為500,

未發現其他人為手工命令將其修改為200,從而確定是打補丁引起的。

    到此問題解決!



    


    


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29357786/viewspace-2284586/,如需轉載,請註明出處,否則將追究法律責任。

相關文章