如何使用awr_set_report_thresholds控制AWR報告裡的sql語句數量

oliseh發表於2015-01-16
AWR報告裡和sql語句有關的section有SQL ordered by Elapsed Time、SQL ordered by CPU Time、SQL ordered by User I/O Wait Time、SQL ordered by Gets等。一次在分析一個負荷較高的資料庫時為了能在上述section中看到更多的SQL語句,特意透過DBMS_WORKLOAD_REPOSITORY.MODIFY_SNAPSHOT_SETTINGS(topnsql=>50)將AWR捕捉的SQL語句數量上限調整為50,可以從dba_hist_wr_control裡查到調整後的結果:
col SNAP_INTERVAL format a30
col RETENTION format a30
set linesize 150
select * from dba_hist_wr_control;
      DBID SNAP_INTERVAL                  RETENTION                      TOPNSQL
---------- ------------------------------ ------------------------------ ----------
 617151977 +00000 01:00:00.0              +00035 00:00:00.0              50


但後來在生成的AWR報告裡,在"SQL ordered by Elapsed Time"、"SQL ordered by CPU Time"等section裡sql語句的數量仍然是10條,並沒有變成50條。後來發現在11gR2裡有DBMS_WORKLOAD_REPOSITORY.AWR_SET_REPORT_THRESHOLDS可以用來控制AWR報告裡的SQL語句的數量,用法如下
DBMS_WORKLOAD_REPOSITORY.AWR_SET_REPORT_THRESHOLDS(
   top_n_events         IN   NUMBER DEFAULT NULL,
   top_n_files          IN   NUMBER DEFAULT NULL,
   top_n_segments       IN   NUMBER DEFAULT NULL,
   top_n_services       IN   NUMBER DEFAULT NULL,
   top_n_sql            IN   NUMBER DEFAULT NULL,
   top_n_sql_max        IN   NUMBER DEFAULT NULL,
   top_sql_pct          IN   NUMBER DEFAULT NULL,
   shmem_threshold      IN   NUMBER DEFAULT NULL,
   versions_threshold   IN   NUMBER DEFAULT NULL);


其中於到sql語句數量有關的引數是top_n_sql、top_n_sql_max、top_sql_pct,如果我們要在生成的AWR報告裡包含50條語句,那麼可以先執行
exec DBMS_WORKLOAD_REPOSITORY.AWR_SET_REPORT_THRESHOLDS(top_n_sql=>50),然後再使用@?/rdbms/admin/awrrpt生成報告,如此報告裡便能看到top 50的SQL了,記住DBMS_WORKLOAD_REPOSITORY.AWR_SET_REPORT_THRESHOLDS的執行結果僅在session級別生效。
對@?/rdbms/admin/awrrpt的執行過程進行了10046 trace,從trace結果裡摘錄了一段生成"SQL ordered by Elapsed Time"資訊的sql:


with sqt as (select elap, cput, exec, iowt, norm_val, sql_id, module,rnum from (select sql_id, module, elap, norm_val, cput, exec, iowt,rownum rnum from (select sql_id,max(module) module,sum(elapsed_time_delta) elap,(100 *(sum(elapsed_time_delta) / nullif(:dbtime,0))) norm_val ,sum(cpu_time_delta) cput,sum(executions_delta) exec,sum(iowait_delta) iowt from dba_hist_sqlstat where dbid = :dbid and instance_number = :inst_num and :bid < snap_id and snap_id <= :eid group by sql_id order by nvl(sum(elapsed_time_delta), -1) desc, sql_id)) where rnum < :tsql_max and (rnum <= :tsql_min or norm_val > :top_pct_sql)) select /*+ NO_MERGE(sqt) */ nvl((sqt.elap/1000000),to_number(null)),sqt.exec,
decode(sqt.exec, 0,to_number(null),(sqt.elap / sqt.exec / 1000000)),sqt.norm_val,decode(sqt.elap, 0, to_number(null), (100 * (sqt.cput / sqt.elap))),decode(sqt.elap, 0, to_number(null), (100 * (sqt.iowt / sqt.elap))),sqt.sql_id,to_clob(decode(sqt.module, null,null,'Module: ' || sqt.module)),nvl(st.sql_text,to_clob('** SQL Text Not Available **')) from sqt, dba_hist_sqltext st where st.sql_id(+) = sqt.sql_id and st.dbid(+) = :dbid order by sqt.rnum


可以看出其中有一段where rnum < :tsql_max and (rnum <= :tsql_min or norm_val > :top_pct_sql)這便是AWR_SET_REPORT_THRESHOLDS的設定值對AWR結果起到的過濾作用,也可以看出dba_hist_sqlstat和dba_hist_sqltext是sql統計結果的主要來源。解釋一下AWR_SET_REPORT_THRESHOLDS裡三個引數top_n_sql、top_n_sql_max、top_sql_pct的用途。抽象一點,top_sql_pct表示某個sql_id對應的sql語句所消耗的資源佔整個DB資源的百分比;
具體一點,
拿sql ordered by elapsed time裡列出的sql來說,top_sql_pct表示每條sql語句消耗的時間佔db time的百分比:top_sql_pct_for_elapsed_time%=(sql_elapse_time/db_time)*100%;
如果拿sql ordered by cpu time裡列出的sql來說,top_sql_pct表示每條sql語句消耗的cpu時間佔db cpu的百分比:top_sql_pct_for_cpu_time%=(sql_cpu_time/db_cpu)*100%;
以此類推,AWR裡用%Total表示了這個百分比值。

top_n_sql、top_n_sql_max都是表示按照Elapsed Time、CPU Time、Gets等指標數值從高到低排序後返回的sql語句的數量,結合top_sql_pct透過下面幾個場景解釋一下top_n_sql、top_n_sql_max所起的作用(以sql ordered by elapsed time為例)

(1)如果top_n_sql=top_n_sql_max=N
返回elapsed time最長的N-1條sql,top_sql_pct值被忽略


(2)如果top_n_sql=N,top_n_sql_max=M,且滿足N+1=M
返回elapsed time最長的N條sql,top_sql_pct值被忽略


(3)如果top_n_sql=N,top_n_sql_max=M,且滿足N+1
返回的sql語句為
elapsed time最長的N條sql
+
從elapsed time最長的M條sql裡選出elasped time最短的(M-N)條sql且從中進一步過濾出%total>top_pct_sql值的N1條sql,這裡M-N=>N1>=0
這種情況下返回的sql數目為:N+N1


(4)如果top_n_sql=N,top_n_sql_max=M,且N>M
返回elapsed time最長的M-1條sql語句,top_pct_sql值被忽略


(5)如果top_n_sql=N,top_n_sql_max為空;
返回elapsed time最長的N條記錄,top_pct_sql值被忽略


(6)如果top_n_sql_max=N,top_n_sql為空;
返回elapsed time最長的10條記錄


從上面的第3種情況可見AWR中返回的sql語句可以由指定topn、外加total%值作為過濾的方式共同作用的


至此,我們已經知道如何使用AWR_SET_REPORT_THRESHOLDS來指定AWR報告裡所列SQL數量的方法了。
其實AWR報告裡的SQL數量取決於兩個因素
1、是MMON程式把多少條SQL從記憶體Flush到AWR裡
2、AWR_SET_REPORT_THRESHOLDS從AWR中的過濾出多少條sql生成在AWR報告裡。


相比之下前者是基礎,從我們已經獲得的知識知道statistics_level引數的取值,DBMS_WORKLOAD_REPOSITORY.MODIFY_SNAPSHOT_SETTINGS裡topnsql的取值決定了有多少SQL從記憶體Flush到AWR:
當statistics_level=typical時這個數字是30
當statistics_level=ALL時這個數字是100
topnsql的優先順序最高,不當能夠直接指定sql數量,而且能夠覆蓋掉statistics_level的功效。


但在11gR2裡實際情況和上述觀點還是有不少差異的,上面的三個約束條件似乎都不起作用。我測試的結果是無論statistics_level=typical還是statistics_level=all(只要不是Basic),無論topnsql的值是多少,mmon都會將盡可能多的sql flush到AWR裡,我是透過下面的方法來驗證的,有興趣的同學可以嘗試一下,這裡就不再贅述驗證過程了


--當statistics_level=typical時,下面的結果>30;當statistics_level=ALL時,下面的結果>100;當topnsql=N時,下面的結果>N
select count(distinct(sql_id)) from dba_hist_sqlstat where snap_id<:end_snap_id and="" snap_id="">= :begin_snap_id; --這裡的end_snap_id和begin_snap_id代表了連續的兩個snap_id,中間沒有gap

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/53956/viewspace-1404578/,如需轉載,請註明出處,否則將追究法律責任。

相關文章