等頻直方圖,計算COST

wei-xh發表於2011-05-14
--------------資料庫版本
SQL> select * from v$version where rownum=1;
BANNER
----------------------------------------------------------------
Oracle Database 10g Enterprise Edition Release 10.2.0.1.0 - Prod


---------------表中資料分佈
SQL> select count(*),id from wxh_tbd group by id;

                      COUNT(*)                             ID
------------------------------ ------------------------------
                        398663                         100000
                         49834                             10
---------------收集直方圖資訊
begin
  dbms_stats.gather_table_stats(ownname          => 'scott',
                                tabname          => 'wxh_tbd',
                                no_invalidate    => FALSE,
                                estimate_percent => 100,
                                method_opt       => 'for all  columns size skewonly',
                                cascade          => true);
end;
/
SQL> SELECT column_name,endpoint_number,endpoint_value FROM USER_HISTOGRAMS WHERE TABLE_NAME='WXH_TBD';

COLUMN_NAME                    ENDPOINT_NUMBER ENDPOINT_VALUE
------------------------------ --------------- --------------
ID                                       49834             10
ID                                      448497         100000
--------------在ID列上建立索引
create index t_d on wxh_tbd(id);
--------------執行查詢
SQL> select /*+ index(wxh_tbd t_d) */count(*) from wxh_tbd where id=10;

                      COUNT(*)
------------------------------
                         49834


執行計劃
----------------------------------------------------------
Plan hash value: 485739739

----------------------------------------------------------
| Id  | Operation         | Name | Rows  | Bytes | Cost  |
----------------------------------------------------------
|   0 | SELECT STATEMENT  |      |     1 |     3 |   100 |
|   1 |  SORT AGGREGATE   |      |     1 |     3 |       |
|*  2 |   INDEX RANGE SCAN| T_D  | 49834 |   145K|   100 |
----------------------------------------------------------

可以看出COST是100

本例中索引的LEVEL 是2
索引頁塊數量是857.
表總行數是448497
根據索引COST公式
COST=blevel +ceiling(leaf_blocks * effective index selectivity)
=2+ceiling(857*effective index selectivity)
關鍵是看這個effective index selectivity怎麼計算。
在列沒有直方圖的情況下,一般等於1/num_distinct
如果謂詞列存在直方圖,就不能採取1/num_distinct了。
我查了好多資料,都沒查到演算法,CBO書裡也沒給出具體的公式。可能是他覺得太簡單了?
那麼猜一下。既然直方圖都把對應列的頻率統計出來了,那麼拿這個頻率除以總行數,不就是選擇率嗎?
驗證下
SQL> select ceil((49834/448497)*875)+2 from dual;

CEIL((49834/448497)*875)+2
--------------------------
                       100
果然不出所料。


[ 本帖最後由 wei-xh 於 2011-5-14 14:58 編輯 ]

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/22034023/viewspace-695365/,如需轉載,請註明出處,否則將追究法律責任。

相關文章