ORACLE 資料庫伺服器業務高峰期高危動作之IOSCAN(HPUNIX)

清風艾艾發表於2019-01-07

      臨近年關,各個資料庫相關的維護都想獲取最新的伺服器狀態,客戶一hpunix系統出現點問題,表現為sar、iostat會被卡住,ioscan執行會使得資料庫log buffer 寫redo堵塞,導致log file sync等待,會話飆升。

     1、現象如下

     

    2、檢視資料庫中的等待事件集中為log file sync,初步定為是儲存寫log buffer 到redo慢

    3、檢查作業系統日誌,發現問題時間點有root執行:ioscan -nf|grep -i E "unclaimed | unknown | NO_HW |SCAN"

    4、經詢問得知,是系統工程師在做掃盤,檢視磁碟是否有壞道壞盤情況,其實是出於好意,但是卻導致了資料庫redo寫入被堵塞,導致資料庫會話飆升,交易超時。

    5、臨時處理措施,可以透過主機重啟解決;但是,客戶結算前禁止主機層次的掃盤動作,此前系統的iostat、sar等命令均會卡住,hpunix分析說是系統的一個BUG,需要升級補丁包。


此外,能引起資料庫事務暫時堵塞的命令還有:alter system switch logfile;和alter system checkpoint;


所以,維護人員要有高度警覺,白天業務高峰期,千萬不要在資料庫伺服器上執行高IO或者高CPU消耗的操作。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29357786/viewspace-2374824/,如需轉載,請註明出處,否則將追究法律責任。

相關文章