AWR報告裡和sql語句有關的section有SQL ordered by Elapsed Time、SQL ordered by CPU Time、SQL ordered by User I/O Wait Time、SQL ordered by Gets等。一次在分析一個負荷較高的資料庫時為了能在上述section中看到更多的SQL語句，特意透過DBMS_WORKLOAD_REPOSITORY.MODIFY_SNAPSHOT_SETTINGS(topnsql=>50)將AWR捕捉的SQL語句數量上限調整為50，可以從dba_hist_wr_control裡查到調整後的結果：
col SNAP_INTERVAL format a30
col RETENTION format a30
set linesize 150
select * from dba_hist_wr_control;
DBID SNAP_INTERVAL RETENTION TOPNSQL
---------- ------------------------------ ------------------------------ ----------
617151977 +00000 01:00:00.0 +00035 00:00:00.0 50

但後來在生成的AWR報告裡，在"SQL ordered by Elapsed Time"、"SQL ordered by CPU Time"等section裡sql語句的數量仍然是10條，並沒有變成50條。後來發現在11gR2裡有DBMS_WORKLOAD_REPOSITORY.AWR_SET_REPORT_THRESHOLDS可以用來控制AWR報告裡的SQL語句的數量，用法如下
DBMS_WORKLOAD_REPOSITORY.AWR_SET_REPORT_THRESHOLDS(
top_n_events IN NUMBER DEFAULT NULL,
top_n_files IN NUMBER DEFAULT NULL,
top_n_segments IN NUMBER DEFAULT NULL,
top_n_services IN NUMBER DEFAULT NULL,
top_n_sql IN NUMBER DEFAULT NULL,
top_n_sql_max IN NUMBER DEFAULT NULL,
top_sql_pct IN NUMBER DEFAULT NULL,
shmem_threshold IN NUMBER DEFAULT NULL,
versions_threshold IN NUMBER DEFAULT NULL);

其中於到sql語句數量有關的引數是top_n_sql、top_n_sql_max、top_sql_pct，如果我們要在生成的AWR報告裡包含50條語句，那麼可以先執行
exec DBMS_WORKLOAD_REPOSITORY.AWR_SET_REPORT_THRESHOLDS(top_n_sql=>50)，然後再使用@?/rdbms/admin/awrrpt生成報告，如此報告裡便能看到top 50的SQL了，記住DBMS_WORKLOAD_REPOSITORY.AWR_SET_REPORT_THRESHOLDS的執行結果僅在session級別生效。
對@?/rdbms/admin/awrrpt的執行過程進行了10046 trace，從trace結果裡摘錄了一段生成"SQL ordered by Elapsed Time"資訊的sql：

with sqt as (select elap, cput, exec, iowt, norm_val, sql_id, module,rnum from (select sql_id, module, elap, norm_val, cput, exec, iowt,rownum rnum from (select sql_id,max(module) module,sum(elapsed_time_delta) elap,(100 *(sum(elapsed_time_delta) / nullif(:dbtime,0))) norm_val ,sum(cpu_time_delta) cput,sum(executions_delta) exec,sum(iowait_delta) iowt from dba_hist_sqlstat where dbid = :dbid and instance_number = :inst_num and :bid < snap_id and snap_id <= :eid group by sql_id order by nvl(sum(elapsed_time_delta), -1) desc, sql_id)) where rnum < :tsql_max and (rnum <= :tsql_min or norm_val > :top_pct_sql)) select /*+ NO_MERGE(sqt) */ nvl((sqt.elap/1000000),to_number(null)),sqt.exec,
decode(sqt.exec, 0,to_number(null),(sqt.elap / sqt.exec / 1000000)),sqt.norm_val,decode(sqt.elap, 0, to_number(null), (100 * (sqt.cput / sqt.elap))),decode(sqt.elap, 0, to_number(null), (100 * (sqt.iowt / sqt.elap))),sqt.sql_id,to_clob(decode(sqt.module, null,null,'Module: ' || sqt.module)),nvl(st.sql_text,to_clob('** SQL Text Not Available **')) from sqt, dba_hist_sqltext st where st.sql_id(+) = sqt.sql_id and st.dbid(+) = :dbid order by sqt.rnum

可以看出其中有一段where rnum < :tsql_max and (rnum <= :tsql_min or norm_val > :top_pct_sql)這便是AWR_SET_REPORT_THRESHOLDS的設定值對AWR結果起到的過濾作用，也可以看出dba_hist_sqlstat和dba_hist_sqltext是sql統計結果的主要來源。解釋一下AWR_SET_REPORT_THRESHOLDS裡三個引數top_n_sql、top_n_sql_max、top_sql_pct的用途。抽象一點，top_sql_pct表示某個sql_id對應的sql語句所消耗的資源佔整個DB資源的百分比；
具體一點，
拿sql ordered by elapsed time裡列出的sql來說，top_sql_pct表示每條sql語句消耗的時間佔db time的百分比：top_sql_pct_for_elapsed_time%=(sql_elapse_time/db_time)*100%；
如果拿sql ordered by cpu time裡列出的sql來說，top_sql_pct表示每條sql語句消耗的cpu時間佔db cpu的百分比：top_sql_pct_for_cpu_time%=（sql_cpu_time/db_cpu)*100%;
以此類推，AWR裡用%Total表示了這個百分比值。

top_n_sql、top_n_sql_max都是表示按照Elapsed Time、CPU Time、Gets等指標數值從高到低排序後返回的sql語句的數量，結合top_sql_pct透過下面幾個場景解釋一下top_n_sql、top_n_sql_max所起的作用(以sql ordered by elapsed time為例)

(1)如果top_n_sql=top_n_sql_max=N
返回elapsed time最長的N-1條sql，top_sql_pct值被忽略

(2)如果top_n_sql=N，top_n_sql_max=M，且滿足N+1=M
返回elapsed time最長的N條sql，top_sql_pct值被忽略

(3)如果top_n_sql=N，top_n_sql_max=M，且滿足N+1
返回的sql語句為
elapsed time最長的N條sql
+
從elapsed time最長的M條sql裡選出elasped time最短的(M-N)條sql且從中進一步過濾出%total>top_pct_sql值的N1條sql，這裡M-N=>N1>=0
這種情況下返回的sql數目為：N+N1

(4)如果top_n_sql=N，top_n_sql_max=M，且N>M
返回elapsed time最長的M-1條sql語句，top_pct_sql值被忽略

(5)如果top_n_sql=N，top_n_sql_max為空；
返回elapsed time最長的N條記錄，top_pct_sql值被忽略

(6)如果top_n_sql_max=N，top_n_sql為空；
返回elapsed time最長的10條記錄

從上面的第3種情況可見AWR中返回的sql語句可以由指定topn、外加total%值作為過濾的方式共同作用的

至此，我們已經知道如何使用AWR_SET_REPORT_THRESHOLDS來指定AWR報告裡所列SQL數量的方法了。
其實AWR報告裡的SQL數量取決於兩個因素
1、是MMON程式把多少條SQL從記憶體Flush到AWR裡
2、AWR_SET_REPORT_THRESHOLDS從AWR中的過濾出多少條sql生成在AWR報告裡。

相比之下前者是基礎，從我們已經獲得的知識知道statistics_level引數的取值，DBMS_WORKLOAD_REPOSITORY.MODIFY_SNAPSHOT_SETTINGS裡topnsql的取值決定了有多少SQL從記憶體Flush到AWR：
當statistics_level=typical時這個數字是30
當statistics_level=ALL時這個數字是100
topnsql的優先順序最高，不當能夠直接指定sql數量，而且能夠覆蓋掉statistics_level的功效。

但在11gR2裡實際情況和上述觀點還是有不少差異的，上面的三個約束條件似乎都不起作用。我測試的結果是無論statistics_level=typical還是statistics_level=all(只要不是Basic)，無論topnsql的值是多少，mmon都會將盡可能多的sql flush到AWR裡，我是透過下面的方法來驗證的，有興趣的同學可以嘗試一下，這裡就不再贅述驗證過程了

--當statistics_level=typical時，下面的結果>30;當statistics_level=ALL時，下面的結果>100;當topnsql=N時，下面的結果>N
select count(distinct(sql_id)) from dba_hist_sqlstat where snap_id<:end_snap_id and="" snap_id="">= :begin_snap_id; --這裡的end_snap_id和begin_snap_id代表了連續的兩個snap_id，中間沒有gap

如何使用awr_set_report_thresholds控制AWR報告裡的sql語句數量

相關文章