序言
本篇主要目的有二:
1、看懂t-sql的執行計劃,明白執行計劃中的一些常識。
2、能夠分析執行計劃,找到優化sql效能的思路或方案。
如果你對sql查詢優化的理解或常識不是很深入,那麼推薦幾騙博文給你:SqlServer效能檢測和優化工具使用詳細 ,sql語句的優化分析,T-sql語句查詢執行順序。
執行計劃簡介
1、什麼是執行計劃?
大哥提交的sql語句,資料庫查詢優化器,經過分析生成多個資料庫可以識別的高效執行查詢方式。然後優化器會在眾多執行計劃中找出一個資源使用最少,而不是最快的執行方案,給你展示出來,可以是xml格式,文字格式,也可以是圖形化的執行方案。
2、預估執行計劃,實際執行計劃
選擇語句,點選上面其中一個執行計劃,預估執行計劃可以立即顯示,而實際執行計劃則需要執行sql語句後出現。預估執行計劃不等於實際執行計劃,但是絕大多數情況下實際的執行計劃跟預估執行計劃都是一致的。統計資訊變更或者執行計劃重編譯等情況下,會造成不同。
3、為什麼要讀懂執行計劃
首先執行計劃讓你知道你複雜的sql到底是怎麼執行的,有沒有按照你想的方案執行,有沒有按照最高效的方式執行,使用啦眾多索引的哪一個,怎麼排序,怎麼合併資料的,有沒有造成不必要資源浪費等等。官方資料顯示,執行t-sql存在問題,80%都可以在執行計劃中找到答案。
4、針對圖形化執行計劃分析
執行計劃,可以以文字,xml,圖形化展示出來。本騙主要以圖形化執行計劃主導進行分析,然而執行計劃中包含78個可用的操作符,本篇也只能對常用的進行分析,常用的幾乎就包含你日常所有的了。Msdn上有圖片介紹:https://msdn.microsoft.com/zh-cn/library/ms175913(v=sql.90).aspx
5、怎麼看執行計劃
圖形化執行計劃是從上到下從又到左看的。
6、清除快取的執行計劃
dbcc freeprocache
dbcc flushprocindb(db_id)
看懂圖形化執行計劃
1、連線
1、越粗表示掃描影響的行數愈多。
2、Actual Number of Rows 掃描中實際影響的的行數。
3、Estimated Number of Rows 預估掃描影響的行數。
4、Estimated row size 操作符生成的行的估計大小(位元組)。
5、Estimated Data Size 預估影響的資料的大小。
2、Tooltips,當前步驟執行資訊
Note:這個tips的資訊告訴我們執行的物件是什麼,採用的操作操作是什麼,查詢的資料是什麼,使用的索引是什麼,排序與否,預估cpu、I/O、影響行數,實際行數等資訊。具體引數清單參見msdn:https://msdn.microsoft.com/zh-cn/library/ms178071(v=sql.90).aspx
3、Table Scan(表掃描)
當表中沒有聚集索引,又沒有合適索引的情況下,會出現這個操作。這個操作是很耗效能的,他的出現也意味著優化器要遍歷整張表去查詢你所需要的資料。
4、Clustered Index Scan(聚集索引掃描)、Index Scan(非聚集索引掃描)
這個圖示兩個操作都可以使用,一個聚集索引掃描,一個是非聚集索引掃描。
聚集索引掃描:聚集索引的資料體積實際是就是表本身,也就是說表有多少行多少列,聚集所有就有多少行多少列,那麼聚集索引掃描就跟表掃描差不多,也要進行全表掃描,遍歷所有表資料,查詢出你想要的資料。
非聚集索引掃描:非聚集索引的體積是根據你的索引建立情況而定的,可以只包含你要查詢的列。那麼進行非聚集索引掃描,便是你非聚集中包含的列的所有行進行遍歷,查詢出你想要的資料。
5、Key Lookup(鍵值查詢)
首先需要說的是查詢,查詢與掃描在效能上完全不是一個級別的,掃描需要遍歷整張表,而查詢只需要通過鍵值直接提取資料,返回結果,效能要好。
當你查詢的列沒有完全被非聚集索引包含,就需要使用鍵值查詢在聚集索引上查詢非聚集索引不包含的列。
6、RID Lookoup(RID查詢)
跟鍵值查詢類似,只不過RID查詢,是需要查詢的列沒有完全被非聚集索引包含,而剩餘的列所在的表又不存在聚集索引,不能鍵值查詢,只能根據行表示Rid來查詢資料。
7、Clustered Index Seek(聚集索引查詢)、Index Seek(非聚集索引查詢)
聚集索引查詢和非聚集索引查詢都是使用該圖示。
聚集索引查詢:聚集索引包含整個表的資料,也就是在聚集索引的資料上根據鍵值取資料。
非聚集索引查詢:非聚集索引包含建立索引時所包含列的資料,在這些非聚集索引的資料上根據鍵值取資料。
8、Hash Match
這個圖示有兩種地方用到,一種是表關聯,一種是資料聚合運算時。
再分別說這兩中運算的前面,我先說說Hashing(編碼技術)和Hash Table(資料結構)。
Hashing:在資料庫中根據每一行的資料內容,轉換成唯一符號格式,存放到臨時雜湊表中,當需要原始資料時,可以給還原回來。類似加密解密技術,但是他能更有效的支援資料查詢。
Hash Table:通過hashing處理,把資料以key/value的形式儲存在表格中,在資料庫中他被放在tempdb中。
接下來,來說說Hash Math的表關聯跟行資料聚合是怎麼操作運算的。
表關聯:
如上圖,關聯兩個資料集時,Hash Match會把其中較小的資料集,通過Hashing運算放入HashTable中,然後一行一行的遍歷較大的資料集與HashTable進行相應的匹配拉取資料。
資料聚合:當查詢中需要進行Count/Sum/Avg/Max/Min時,資料可能會採用把資料先放在記憶體中的HashTable中然後進行運算。
9、Nested Loops
這個操作符號,把兩個不同列的資料集彙總到一張表中。提示資訊中的Output List中有兩個資料集,下面的資料集(inner set)會一一掃描與上面的資料集(out set),知道掃描完為止,這個操作才算是完成。
10、Merge Join
這種關聯演算法是對兩個已經排過序的集合進行合併。如果兩個聚合是無序的則將先給集合排序再進行一一合併,由於是排過序的集合,左右兩個集合自上而下合併效率是相當快的。
11、Sort(排序)
對資料集合進行排序,需要注意的是,有些資料集合在索引掃描後是自帶排序的。
12、Filter(篩選)
根據出現在having之後的操作運算子,進行篩選
13、Computer Scalar
在需要查詢的列中需要自定義列,比如count(*) as cnt ,select name+''+age 等會出現此符號。
根據執行計劃細節要做的優化操作
這裡會有很多建議給出,我不一一舉例了,給出幾個示例,想做到優化行家,多的還需要大家去悟去理解。
1、如果select * 通常情況下聚集索引會比非聚集索引更優。
2、如果出現Nested Loops,需要查下是否需要聚集索引,非聚集索引是否可以包含所有需要的列。
3、Hash Match連線操作更適合於需要做Hashing演算法集合很小的連線。
4、Merge Join時需要檢查下原有的集合是否已經有排序,如果沒有排序,使用索引能否解決。
5、出現表掃描,聚集索引掃描,非聚集索引掃描時,考慮語句是否可以加where限制,select * 是否可以去除不必要的列。
6、出現Rid查詢時,是否可以加索引優化解決。
7、在計劃中看到不是你想要的索引時,看能否在語句中強制使用你想用的索引解決問題,強制使用索引的辦法Select CluName1,CluName2 from Table with(index=IndexName)。
8、看到不是你想要的連線演算法時,嘗試強制使用你想要的演算法解決問題。強制使用連線演算法的語句:select * from t1 left join t2 on t1.id=t2.id option(Hash/Loop/Merge Join)
9、看到不是你想要的聚合演算法是,嘗試強制使用你想要的聚合演算法。強制使用聚合演算法的語句示例:select age ,count(age) as cnt from t1 group by age option(order/hash group)
10、看到不是你想要的解析執行順序是,或這解析順序耗時過大時,嘗試強制使用你定的執行順序。option(force order)
11、看到有多個執行緒來合併執行你的sql語句而影響到效能時,嘗試強制是不併行操作。option(maxdop 1)
12、在儲存過程中,由於引數不同導致執行計劃不同,也影響啦效能時嘗試指定引數來優化。option(optiomize for(@name='zlh'))
13、不操作多餘的列,多餘的行,不做務必要的聚合,排序。
小結
已經到晚間2點半啦,查詢優化沒有做過於詳細的分解,見諒,如果你在看到本文後有什麼疑問,歡迎加入部落格左上角群,一起交流學習,安。