淺談SQL Server中統計對於查詢的影響

宋沄劍發表於2015-12-19

簡介

SQL Server查詢分析器是基於開銷的。通常來講，查詢分析器會根據謂詞來確定該如何選擇高效的查詢路線,比如該選擇哪個索引。而每次查詢分析器尋找路徑時，並不會每一次都去統計索引中包含的行數，值的範圍等，而是根據一定條件建立和更新這些資訊後儲存到資料庫中，這也就是所謂的統計資訊。

如何檢視統計資訊

檢視SQL Server的統計資訊非常簡單，使用如下指令：

DBCC SHOW_STATISTICS(‘表名’,’索引名’)

所得到的結果如圖1所示。

圖1.統計資訊

統計資訊如何影響查詢

下面我們通過一個簡單的例子來看統計資訊是如何影響查詢分析器。我建立一個測試表，有兩個INT值的列，其中id為自增，ref上建立非聚集索引，插入100條資料，從1到100，再插入9900條等於100的資料。圖1中的統計資訊就是示例資料的統計資訊。

此時，我where後使用ref值作為查詢條件，但是給定不同的值，我們可以看出根據統計資訊，查詢分析器做出了不同的選擇，如圖2所示。

圖2.根據不同的謂詞，查詢優化器做了不同的選擇

其實，對於查詢分析器來說，柱狀圖對於直接可以確定的謂詞非常管用，這些謂詞比如:

where date = getdate()
where id= 12345
where monthly_sales < 10000 / 12
where name like “Careyson” + “%”

但是對於比如

where price = @vari
where total_sales > (select sum(qty) from sales)
where a.id =b.ref_id

where col1 =1 and col2=2

這類在執行時才能知道值的查詢，取樣步長就明顯不是那麼好用了。另外，上面第四行如果謂詞是兩個查詢條件，使用取樣步長也並不好用。因為無論索引有多少列，取樣步長僅僅儲存索引的第一列。當柱狀圖不再好用時，SQL Server使用密度來確定最佳的查詢路線。

密度的公式是：1/表中唯一值的個數。當密度越小時，索引越容易被選中。比如圖1中的第二個表，我們可以通過如下公式來計算一下密度:

圖3.某一列的密度

根據公式可以推斷，當表中的資料量逐漸增大時，密度會越來越小。

對於那些不能根據取樣步長做出選擇的查詢，查詢分析器使用密度來估計行數,這個公式為:估計的行數=表中的行數*密度

那麼，根據這個公式，如果我做查詢時，估計的行數就會為如圖4所示的數字。

圖4.估計的行數

我們來驗證一下這個結論,如圖5所示。

圖5.估計的行數

因此，可以看出，估計的行數是和實際的行數有出入的，當資料分佈均勻時，或者資料量大時，這個誤差將會變的非常小。

統計資訊的更新

由上面的例子可以看到，查詢分析器由於依賴於統計資訊進行查詢，那麼過時的統計資訊則可能導致低效率的查詢。統計資訊既可以由SQL Server來進行管理，也可以手動進行更新，也可以由SQL Server管理更新時手動更新。

當開啟了自動更新後，SQL Server監控表中的資料更改，當達到臨界值時則會自動更新資料。這個標準是:

向空表插入資料時
少於500行的表增加500行或者更多
當表中行多於500行時，資料的變化量大於20%時

上述條件的滿足均會導致統計被更新。

當然，我們也可以使用如下語句手動更新統計資訊。

UPDATE STATISTICS 表名[索引名]

列級統計資訊

SQL Server還可以針對不屬於任何索引的列建立統計資訊來幫助查詢分析器獲取”估計的行數“.當我們開啟資料庫級別的選項“自動建立統計資訊”如圖6所示。

圖6.自動建立統計資訊

當這個選項設定為True時，當我們where謂詞指定了不在任何索引上的列時，列的統計資訊會被建立，但是會有以下兩種情況例外:

建立統計資訊的成本超過生成查詢計劃的成本
當SQL Server忙時不會自動生成統計資訊

我們可以通過系統檢視sys.stats來檢視這些統計資訊,如圖7所示。

圖7.通過系統檢視檢視統計資訊

當然，也可以通過如下語句手動建立統計資訊:

CREATE STATISTICS 統計名稱 ON 表名 (列名 [,…n])

總結

本文簡單談了統計資訊對於查詢路徑選擇的影響。過時的統計資訊很容易造成查詢效能的降低。因此，定期更新統計資訊是DBA重要的工作之一。

淺談SQL Server中的快照問題
2021-09-09
SQLServer
淺談疫情對消費金融的影響
2020-02-27
MySQL：查詢欄位數量多少對查詢效率的影響
2019-12-13
MySql
淺談寶物系統對《率土之濱》的生態影響
2020-08-04
Microsoft SQL Server 2005中查詢優化器使用的統計資訊二(zt)
2019-03-02
ROSSQLServer優化
Microsoft SQL Server 2005中查詢優化器使用的統計資訊一(zt)
2019-07-07
ROSSQLServer優化
Microsoft SQL Server 2005中查詢優化器使用的統計資訊三(zt)
2019-06-07
ROSSQLServer優化
淺談TypeScript對業務可維護性的影響
2024-04-03
TypeScript
SQL Server中事務日誌自動增長對效能的影響（下）PG
2022-03-22
SQLServer
SQL Server中事務日誌自動增長對效能的影響（上）OS
2022-03-22
SQLServer
Sql Server 的引數化查詢
2019-04-10
SQLServer
淺談邊緣計算對企業安全建設的影響及趨勢
2021-11-09
Postgresql MVCC架構對從庫長查詢的影響
2019-02-05
SQLMVC架構
dex最佳化對Arouter查詢路徑的影響
2021-06-01
sql-server高階查詢
2020-12-29
SQLServer
SQL Server中Table字典資料的查詢SQL示例程式碼
2018-12-17
SQLServer
SQL Server查詢慢的解決方案
2022-09-02
SQLServer
淺談畢業院校對程式設計師的影響--蝴蝶如何飛的過滄海？
2018-10-01
程式設計師
Ms Sql Server查詢儲存過程中的內容
2024-07-10
SQLServer儲存過程
SQL Server 查詢歷史執行的SQL語句
2020-12-07
SQLServer
windows server許可權對tomcat的影響
2024-12-03
WindowsServerTomcat
[20190524]淺談模糊查詢.txt
2019-05-24
SQL Server 跨資料庫查詢
2020-05-17
SQLServer資料庫
sql-server不相關子查詢
2020-12-29
SQLServer
sql-server相關子查詢
2020-12-29
SQLServer
DbForge Studio for SQL Server入門教程：在查詢生成器中建立查詢
2018-08-30
SQLServer
Oracle多列統計資訊與直方圖對有關聯多列查詢影響
2021-05-18
Oracle直方圖
SQL Server索引查詢/掃描沒有出現key lookup的案例淺析
2024-03-14
SQLServer索引
INDEX建立方式對SQL的影響
2021-09-09
IndexSQL
SQL Server解惑——查詢條件IN中能否使用變數
2021-01-18
SQLServer變數
sql server對於日期的處理
2019-11-18
SQLServer
淺談資料中心智慧化轉型對節能降耗的影響
2023-01-03
SQL Server 查詢超時問題排查
2024-05-22
SQLServer
SQL Server 語句日期格式查詢方法
2024-09-13
SQLServer
SQL Server-簡單查詢語句
2021-09-09
SQLServer
在 SQL Server 中查詢活動連線和死鎖
2022-07-15
SQLServer
查詢SQL Server的歷史執行記錄
2024-04-27
SQLServer
淺談伺服器頻寬對訪問速度的影響——宇眾網路
2020-03-27
伺服器
SQL 查詢中的 NULL 值
2020-04-05
SQLNull

淺談SQL Server中統計對於查詢的影響

簡介

如何檢視統計資訊

統計資訊如何影響查詢

統計資訊的更新

列級統計資訊

總結

相關文章