常用SQL語句優化技巧

FrankYou發表於2015-07-22

除了建立索引之外,保持良好的SQL語句編寫習慣將會降低SQL效能問題發生。

 

①通過變數的方式來設定引數


好:stringsql = "select * from people p where p.id = ? ";

壞:stringsql = "select * from people p where p.id = "+id;

 

資料庫的SQL文解析和執行計劃會儲存在快取中,但是SQL文只要有變化,就得重新解析。

“…where p.id = ”+id的方式在id值發生改變時需要重新解析,這會耗費時間。

 

②不要使用select *


好:stringsql = "select people_name,pepole_age from people ";

壞:stringsql = "select * from people ";

 

使用select *的話會增加解析的時間,另外會把不需要的資料也給查詢出來,資料傳輸也是耗費時間的,

比如text型別的欄位通常用來儲存一些內容比較繁雜的東西,如果使用select *則會把該欄位也查詢出來。

 

③謹慎使用模糊查詢


好:stringsql = "select * from people p where p.id like 'parm1%' ";

壞:stringsql = "select * from people p where p.id like '%parm1%' ";

 

當模糊匹配以%開頭時,該列索引將失效,若不以%開頭,該列索引有效。

 

④不要使用列號


好:stringsql = "select people_name,pepole_age from people order by name,age";

壞:stringsql = "select people_name,pepole_age from people order by 6,8";

 

使用列號的話,將會增加不必要的解析時間。

 

⑤優先使用UNION ALL,避免使用UNION


好:stringsql = “select name from student union all select name from teacher";

壞:stringsql = “select name from student union select name from teacher";

 

UNION 因為會將各查詢子集的記錄做比較,故比起UNION ALL ,通常速度都會慢上許多。一般來說,如果使用UNION ALL能滿足要求的話,務必使用UNION ALL。還有一種情況,如果業務上能夠確保不會出現重複記錄。

 

⑥在where語句或者order by語句中避免對索引欄位進行計算操作


好:stringsql = "select people_name,pepole_age from people where create_date=date1 ";

壞:stringsql = "select people_name,pepole_age from people where trunc(create_date)=date1";

 

當在索引列上進行操作之後,索引將會失效。正確做法應該是將值計算好再傳入進來。

 

⑦使用not exist代替not in


好:stringsql = “select * from orders where customer_name not exist (select customer_name from customer)";

壞:stringsql = “select * from orders where customer_name not in(select customer_name from customer)";

 

如果查詢語句使用了not in 那麼內外表都進行全表掃描,沒有用到索引;而not extsts 的子查詢依然能用到表上的索引。

 

⑧ exist和in的區別

 

in 是把外表和內表作hash 連線,而exists是對外表作loop迴圈,每次loop迴圈再對內表進行查詢。因此,in用到的是外表的索引, exists用到的是內表的索引。

如果查詢的兩個表大小相當,那麼用in和exists差別不大。
如果兩個表中一個較小,一個是大表,則子查詢表大的用exists,子查詢表小的用in:
例如:表A(小表),表B(大表)

1:

select * from A where cc in (select cc from B)
效率低,用到了A表上cc列的索引;

select * from A where exists(select cc from B where cc=A.cc)
效率高,用到了B表上cc列的索引。
2:

select * from B where cc in (select cc from A)
效率高,用到了B表上cc列的索引;

select * from B where exists(select cc from A where cc=B.cc)
效率低,用到了A表上cc列的索引。

 

⑨避免在索引列上做如下操作:

 

◆避免在索引欄位上使用<>,!=

◆避免在索引列上使用IS NULL和IS NOT NULL

◆避免在索引列上出現資料型別轉換(比如某欄位是String型別,引數傳入時是int型別)


當在索引列上使用如上操作時,索引將會失效,造成全表掃描。

 

⑩複雜操作可以考慮適當拆成幾步

 

有時候會有通過一個SQL語句來實現複雜業務的例子出現,為了實現複雜的業務,巢狀多級子查詢。造成

SQL效能問題。對於這種情況可以考慮拆分SQL,通過多個SQL語句實現,或者把部分程式能完成的工作交給程式完成。

相關文章