ORACLE 11.2.0.4 for HPUNIX 業務SQL處理資料量變化導致的CPU使用率超標觸發告警
某客戶oracle 11.2.0.4 rac for HPUNIX系統,由於業務SQL處理的資料量變化導致的CPU使用率超標,引起告警。
一、問題描述
2018 年 9 月 22 日, 2:50:00 核心庫的 CPU 使用率達到 87% 觸發告警。
二、提取的分析日誌
提取資料庫問題時段資料庫告警日誌; 取資料庫 2018 年 9 月 22 日 1:00:00~2:00:00 、 2:00:00~3:00:00 的 awr 及其對比;取資料庫 2018 年 9 月 22 日 1:00:00~2:00:00 、 2:00:00~3:00:00 的的 OSW 並生成圖表觀察 2 個時間點的 CPU 使用情況進行對比。
三、問題分析
1、oswatch 提取 CPU 使用率相關對比
2018-9-21 1:00:00~3:00:00 2018-9-22 1:00:00~3:00:00
根據 2018-9-21~22 1:00:00~3:00:00 系統使用率對比,確定 2018-9-22 1:30:00~2:00:00 ,系統的 CPU 使用率接近 90% 。
2、對比 2018-9-21~22 1:00:00~2:00:00 兩個時間段的 awr
2.1 資料庫 2018-9-21~22 1:00:00~2:00:00 兩個時間的 DBTIME 對比
從資料庫 dbtime 對比, 2018-9-21 1:00:00~2:00:00 dbtime 指標值是 3923 , 2018-9-22 1:00:00~2:00:00 dbtime 指標值是 4230 ,相差 300 並不算太多。
2.2 2018-9-21~22 1:00:00~2:00:00 兩個時間的 LOAD PROFILE 對比
2018-9-21 1:00:00~2:00:00 loadprofile parses 指標值高達 337 每秒, 2018-9-22 1:00:00~2:00:00 loadprofile parses 指標值只有 21.2 ; 2018-9-21 1:00:00~2:00:00 loadprofile Hard parses 指標值高達 154 每秒, 2018-9-22 1:00:00~2:00:00 loadprofile parses 指標值只有 10.7 。 從 loadprofile 對比可知, 2018-9-22 1:00:00~2:00:00 ,硬解析比較嚴重,硬解析嚴重會導致 latch 爭用事件,引起資料庫伺服器 CPU 飆高。
2018-9-21 1:00:00~2:00:00 資料庫頂級等待事件對比, 2018-9-22 1:00:00~2:00:00 等待事件 latch:row cache objects 、 latch:cache buffers chans 嚴重,吻合 loadproile 中硬解析相關指標 Hard parses 、 parses 高的情況。
2.3 資料庫頂級等待事件對比
2018-9-21~22 1:00:00~2:00:00 資料庫 TOP SQL ordered by Elapsed Time 對比, 2018-9-22 1:00:00~2:00:00 資料庫自動任務 SQL tunning Advisor 啟用並佔用比較多的 CPU 資源。
2.4 2018-9-21~22 1:00:00~2:00:00 兩個時間對比發現的問題 SQL
2018-9-22 1:00:00~2:00:00 時段有一條 SQL 語句佔用 CPU 比較突出: 1 小時內執行 5645 次,每次執行平均耗時 14.56 秒 。
select * from adkmx where ((((faredm=:b0 and jiluzt='0') and yngyjg=:b1) and jioyrq=:b2) and joyisj='LN_JIEX') order by HUOBDH, DAIKZH, MXXHAO
對比 的執行歷史,發現 2018-9-22 日,該 sql 語句 fetch 的資料量 394304 比平時的 6300 多了近 70 倍,行處理 776277 比平時 1400 多了近 554 倍, cpu 消耗 54548.460 比平時的 700 多近 80 倍,這是 在執行時 CPU 消耗過高的真正原因。
四、問題總結
1 、 在 2018-9-22 日 fetch 的資料量 394304 比平時的 6300 多了近 70 倍,行處理 776277 比平時 1400 多了近 554 倍, cpu 消耗 54548.460 比平時的 700 多近 80 倍,是 在執行時 CPU 消耗過高的真正原因。
2 、另外, 2018-9-22 1:00:00~2:00:00 相比正常時段 2018-9-21 1:00:00~2:00:00 ,資料庫的硬解析比較突出。導致硬解析嚴重的原因是,應用的部分 sql 語句沒有使用繫結變數,資料庫沒有關閉 sql 自適應遊標共享。
3 、 2018-9-22 1:00:00~2:00:00 相比正常時段 2018-9-21 1:00:00~2:00:00 ,資料庫有 SQL TUNNING ADVISOR 自動維護任務執行,並且消耗比較高的 CPU 資源。
五、建議
1、 請甲方老師聯絡業務評估 SQL( ) 處理資料量的合理性,避免資料庫伺服器夯死;
2、 資料庫關閉 sql 遊標共享;
3、 調整應用 sql 語句使用繫結變數;
4、關閉資料庫 STA ( SQL Tunning advisor );
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29357786/viewspace-2215301/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【RAC】處理因ons導致CPU使用率過高的問題
- Oracle優化案例-緊急處理一條sql引起cpu使用率99%的問題(十六)Oracle優化SQL
- Oracle CPU使用率過高問題處理Oracle
- crontab導致CPU異常的問題分析及處理
- ORACLE DML執行計劃頻繁變更導致業務響應極慢問題的處理Oracle
- 併發請求導致的業務處理安全風險及解決方案求導
- RabbitMQ 處理過慢,原來是一個 SQL 快取框架導致的 GC 頻繁觸發MQSQL快取框架GC
- MySQL 業務表索引過多導致業務高峰期伺服器CPU使用率百分百MySql索引伺服器
- 使用資料庫處理併發可能導致的問題資料庫
- 關於大資料量的處理大資料
- 並行設定不當導致資料處理速度變慢並行
- Oracle效能優化-資料庫CPU使用率100%Oracle優化資料庫
- 效能分析(5)- 軟中斷導致 CPU 使用率過高的案例
- sqlldr標準輸出未處理導致批處理掛起問題SQL
- 執行計劃變化導致CPU負載高的問題分析負載
- Oracle全部索引丟失導致的效率問題處理Oracle索引
- ORACLE 告警日誌alert過大的處理Oracle
- Oracle 11.2.0.4 Dataguard兩則故障處理Oracle
- oracle goldengate 目標端表空間滿導致程式abended處理過程OracleGo
- 一條主鍵索引SQL導致的CPU被打滿索引SQL
- 【故障處理】序列cache值過小導致CPU利用率過高
- Java 大資料量處理問題Java大資料
- 【SQL】Oracle SQL處理的流程SQLOracle
- 根據業務寫觸發器(oracle觸發器片)觸發器Oracle
- Oracle SQL處理OracleSQL
- oracle遊標批次處理資料Oracle
- cassandra業務資料一致性問題處理?
- Salesforce 大資料量處理篇(二)IndexSalesforce大資料Index
- 大資料量處理實踐方案整理大資料
- oracle執行系統比較慢,cpu使用率高的檢查和緊急處理Oracle
- Oracle SYSAUX 表空間使用率100% 導致的DB 故障OracleUX
- 處理 Element Plus 告警
- 詳述一條SQL引發的高CPU故障處理過程SQL
- 包含觸發器的LOB表執行IMP導致EMPTY_LOB變為空觸發器
- goldengate 觸發器導致oracle 表空間不能onlineGo觸發器Oracle
- Oracle資料庫 11.2.0.4 EMON程式持續消耗CPUOracle資料庫
- wpf popup導致MouseLeftButtonUp無法觸發
- oracle goldengate ddl 操作導致複製程式abended處理案例OracleGo