[轉載]程式設計師必備：書寫高質量SQL的30條建議

oliver-l發表於2020-10-22

原文網址 : https://learnku.com/articles/50883

程式設計師SQL

部落格轉載自程式設計師必備：書寫高質量SQL的30條建議

以下文章來源於撿田螺的小男孩，作者撿田螺的小男孩

比較實用的sql優化語句，所以想分享轉載一下，也方便以後自己查閱

以下是轉載內容：

本文將結合例項demo，闡述30條有關於優化SQL的建議，多數是實際開發中總結出來的，希望對大家有幫助。

1、查詢SQL儘量不要使用select *，而是select具體欄位。

反例：

select * from employee;

正例：

select id,name from employee;

理由：

只取需要的欄位，節省資源、減少網路開銷。
select * 進行查詢時，很可能就不會使用到覆蓋索引了，就會造成回表查詢。

2、如果知道查詢結果只有一條或者只要最大/最小一條記錄，建議用limit 1。

假設現在有employee員工表，要找出一個名字叫jay的人。

CREATE TABLE `employee`(

反例：

select id,name from employee where name='jay';

正例：

select id,name from employee where name='jay' limit 1;

理由：

加上limit 1後，只要找到了對應的一條記錄，就不會繼續向下掃描了，效率將會大大提高。
當然，如果name是唯一索引的話，就沒必要加上limit 1了，因為limit的存在主要就是為了防止全表掃描，從而提高效能，如果一個語句本身可以預知不用全表掃描，有沒有limit ，效能的差別並不大。

3、應儘量避免在where子句中使用or來連線條件。

新建一個user表，它有一個普通索引userId，表結構如下：

CREATE TABLE `user`(

假設現在需要查詢userid為1或者年齡為18歲的使用者，很容易有以下SQL：

反例：

select * from user where userid=1 or age =18

正例：

//使用union all

理由：

使用or可能會使索引失效，從而全表掃描。

對於or+沒有索引的age這種情況，假設它走了userId的索引，但是走到age查詢條件時，它還得全表掃描，也就是需要三步過程：全表掃描+索引掃描+合併。如果它一開始就走全表掃描，直接一遍掃描就完事。mysql是有優化器的，處於效率與成本考慮，遇到or條件，索引可能失效，看起來也合情合理。

4、優化limit分頁。

我們日常做分頁需求時，一般會用 limit 實現，但是當偏移量特別大的時候，查詢效率就變得低下。

反例：

select id,name,age from employee limit 10000,10

正例：

//方案一 ：返回上次查詢的最大記錄(偏移量)

理由：

當偏移量最大的時候，查詢效率就會越低，因為Mysql並非是跳過偏移量直接去取後面的資料，而是先把偏移量+要取的條數，然後再把前面偏移量這一段的資料拋棄掉再返回的。
如果使用優化方案一，返回上次最大查詢記錄（偏移量），這樣可以跳過偏移量，效率提升不少。
方案二使用order by+索引，也是可以提高查詢效率的。
方案三的話，建議跟業務討論，有沒有必要查這麼後的分頁啦。因為絕大多數使用者都不會往後翻太多頁。

5、優化你的like語句。

日常開發中，如果用到模糊關鍵字查詢，很容易想到like，但是like很可能讓你的索引失效。

反例：

select userId,name from user where userId like '%123';

正例：

select userId,name from user where userId like '123%';

理由：

把%放前面，並不走索引，如下：
把% 放關鍵字後面，還是會走索引的，如下：

6、使用where條件限定要查詢的資料，避免返回多餘的行。

假設業務場景是這樣：查詢某個使用者是否是會員。

曾經看過老的實現程式碼是這樣。。。

反例：

List<Long> userIds = sqlMap.queryList("select userId from user where isVip=1");

正例：

Long userId = sqlMap.queryObject("select userId from user where userId='userId' and isVip='1' ");

理由：

需要什麼資料，就去查什麼資料，避免返回不必要的資料，節省開銷。

7、儘量避免在索引列上使用mysql的內建函式。

業務需求：查詢最近七天內登陸過的使用者（假設loginTime加了索引）。

反例：

select userId,loginTime from loginuser where Date_ADD(loginTime,Interval 7 DAY) >=now();

正例：

explain select userId,loginTime from loginuser where  loginTime >= Date_ADD(NOW(),INTERVAL - 7 DAY);

理由：

索引列上使用mysql的內建函式，索引失效。
如果索引列不加內建函式，索引還是會走的。

8、應儘量避免在where子句中對欄位進行表示式操作，這將導致系統放棄使用索引而進行全表掃。

反例：

select * from user where age-1=10;

正例：

select * from user where age =11;

理由：

雖然age加了索引，但是因為對它進行運算，索引直接迷路了。

9、inner join 、left join、right join，優先使用inner join，如果是left join，左邊表結果儘量小。

inner join 內連線，在兩張表進行連線查詢時，只保留兩張表中完全匹配的結果集。

left join 在兩張表進行連線查詢時，會返回左表所有的行，即使在右表中沒有匹配的記錄。

right join 在兩張表進行連線查詢時，會返回右表所有的行，即使在左表中沒有匹配的記錄。

都滿足SQL需求的前提下，推薦優先使用inner join（內連線），如果要使用left join，左邊表資料結果儘量小，如果有條件的儘量放到左邊處理。

反例：

select * from tab1 t1 left join tab2 t2 on t1.size = t2.size where t1.id>2;

正例：

select * from (select * from tab1 where id >2) t1 left join tab2 t2 on t1.size = t2.size;

理由：

如果inner join是等值連線，或許返回的行數比較少，所以效能相對會好一點。
同理，使用了左連線，左邊表資料結果儘量小，條件儘量放到左邊處理，意味著返回的行數可能比較少。

10、應儘量避免在where子句中使用!=或<>操作符，否則引擎將放棄使用索引而進行全表掃描。

反例：

select age,name from user where age <>18;

正例：

//可以考慮分開兩條sql寫

理由：

使用!=和<>很可能會讓索引失效。

11、使用聯合索引時，注意索引列的順序，一般遵循最左匹配原則。

表結構：（有一個聯合索引idxuseridage，userId在前，age在後）。

CREATE TABLE `user`(

反例：

select * from user where age = 10;

正例：

//符合最左匹配原則

理由：

當我們建立一個聯合索引的時候，如(k1,k2,k3)，相當於建立了（k1）、(k1,k2)和(k1,k2,k3)三個索引，這就是最左匹配原則。
聯合索引不滿足最左原則，索引一般會失效，但是這個還跟Mysql優化器有關的。

12、對查詢進行優化，應考慮在where及order by涉及的列上建立索引，儘量避免全表掃描。

反例：

select * from user where address ='深圳' order by age ;

正例：

//新增索引

13、如果插入資料過多，考慮批量插入。

反例：

for(User u :list){

正例：

//一次500批量插入，分批進行

理由：

批量插入效能好，更加省時間。

打個比喻：假如你需要搬一萬塊磚到樓頂，你有一個電梯，電梯一次可以放適量的磚（最多放500），你可以選擇一次運送一塊磚，也可以一次運送500塊磚，你覺得哪個時間消耗大？

14、在適當的時候，使用覆蓋索引。

覆蓋索引能夠使得你的SQL語句不需要回表，僅僅訪問索引就能夠得到所有需要的資料，大大提高了查詢效率。

反例：

// like模糊查詢，不走索引了

正例：

//id為主鍵，那麼為普通索引，即覆蓋索引登場了。

15、慎用distinct關鍵字。

distinct 關鍵字一般用來過濾重複記錄，以返回不重複的記錄。在查詢一個欄位或者很少欄位的情況下使用時，給查詢帶來優化效果。但是在欄位很多的時候使用，卻會大大降低查詢效率。

反例：

SELECT DISTINCT * from user;

正例：

select DISTINCT name from user;

理由：

帶distinct的語句cpu時間和佔用時間都高於不帶distinct的語句。因為當查詢很多欄位時，如果使用distinct，資料庫引擎就會對資料進行比較，過濾掉重複資料，然而這個比較、過濾的過程會佔用系統資源，cpu時間。

16、刪除冗餘和重複索引。

反例：

KEY `idx_userId` (`userId`)

正例：

//刪除userId索引，因為組合索引（A，B）相當於建立了（A）和（A，B）索引

理由：

重複的索引需要維護，並且優化器在優化查詢的時候也需要逐個地進行考慮，這會影響效能的。

17、如果資料量較大，優化你的修改/刪除語句。

避免同時修改或刪除過多資料，因為會造成cpu利用率過高，從而影響別人對資料庫的訪問。

反例：

//一次刪除10萬或者100萬+？

正例：

//分批進行刪除，如每次500

理由：

一次性刪除太多資料，可能會有lock wait timeout exceed的錯誤，所以建議分批操作。

18、where子句中考慮使用預設值代替null。

反例：

select * from user where age is not null;

正例：

//設定0為預設值

理由：

並不是說使用了is null 或者 is not null 就會不走索引了，這個跟mysql版本以及查詢成本都有關。

如果mysql優化器發現，走索引比不走索引成本還要高，肯定會放棄索引，這些條件 !=，<>，is null，is not null經常被認為讓索引失效，其實是因為一般情況下，查詢的成本高，優化器自動放棄索引的。

如果把null值，換成預設值，很多時候讓走索引成為可能，同時，表達意思會相對清晰一點。

19、不要有超過5個以上的表連線。

連表越多，編譯的時間和開銷也就越大。
把連線表拆開成較小的幾個執行，可讀性更高。
如果一定需要連線很多表才能得到資料，那麼意味著糟糕的設計了。

20、exist&in的合理利用

假設表A表示某企業的員工表，表B表示部門表，查詢所有部門的所有員工，很容易有以下SQL：

select * from A where deptId in (select deptId from B);

這樣寫等價於：

先查詢部門表B

select deptId from B

再由部門deptId，查詢A的員工

select * from A where A.deptId = B.deptId

可以抽象成這樣的一個迴圈：

List<> resultSet;

顯然，除了使用in，我們也可以用exists實現一樣的查詢功能，如下：

select * from A where exists (select 1 from B where A.deptId = B.deptId);

因為exists查詢的理解就是，先執行主查詢，獲得資料後，再放到子查詢中做條件驗證，根據驗證結果（true或者false），來決定主查詢的資料結果是否保留。

那麼，這樣寫就等價於：

select * from A，先從A表做迴圈

select * from B where A.deptId = B.deptId，再從B表做迴圈

同理，可以抽象成這樣一個迴圈：

List<> resultSet ;

資料庫最費勁的就是跟程式連結釋放。假設連結了兩次，每次做上百萬次的資料集查詢，查完就走，這樣就只做了兩次；相反建立了上百萬次連結，申請連結釋放反覆重複，這樣系統就受不了了。即mysql優化原則，就是小表驅動大表，小的資料集驅動大的資料集，從而讓效能更優。

因此，我們要選擇最外層迴圈小的，也就是，如果B的**資料量小於A，則適合使用in，如果B的資料量大於A，則適合選擇exist**。

21、儘量用union all替換union。

如果檢索結果中不會有重複的記錄，推薦union all 替換 union。

反例：

select * from user where userid=1

正例：

select * from user where userid=1

理由：

如果使用union，不管檢索結果有沒有重複，都會嘗試進行合併，然後在輸出最終結果前進行排序。如果已知檢索結果沒有重複記錄，使用union all 代替union，這樣會提高效率。

22、索引不宜太多，一般5個以內。

索引並不是越多越好，索引雖然提高了查詢的效率，但是也降低了插入和更新的效率。
insert或update時有可能會重建索引，所以建索引需要慎重考慮，視具體情況來定。
一個表的索引數最好不要超過5個，若太多需要考慮一些索引是否有存在的必要。

23、儘量使用數字型欄位，若只含數值資訊的欄位儘量不要設計為字元型。

反例：

`king_id` varchar(20) NOT NULL COMMENT '守護者Id'

正例：

`king_id` int(11) NOT NULL COMMENT '守護者Id'

理由：

相對於數字型欄位，字元型會降低查詢和連線的效能，並會增加儲存開銷。

24、索引不適合建在有大量重複資料的欄位上，如性別這型別資料庫欄位。

因為SQL優化器是根據表中資料量來進行查詢優化的，如果索引列有大量重複資料，Mysql查詢優化器推算發現不走索引的成本更低，很可能就放棄索引了。

25、儘量避免向客戶端返回過多資料量。

假設業務需求是，使用者請求檢視自己最近一年觀看過的直播資料。

反例：

//一次性查詢所有資料回來

正例：

//分頁查詢

26、當在SQL語句中連線多個表時，請使用表的別名，並把別名字首於每一列上，這樣語義更加清晰。

反例：

select * from A inner

正例：

select memeber.name,deptment.deptName from A member inner

27、儘可能使用varchar/nvarchar 代替 char/nchar。

反例：

`deptName` char(100) DEFAULT NULL COMMENT '部門名稱'

正例：

`deptName` varchar(100) DEFAULT NULL COMMENT '部門名稱'

理由：

因為首先變長欄位儲存空間小，可以節省儲存空間。
其次對於查詢來說，在一個相對較小的欄位內搜尋，效率更高。

28、為了提高group by語句的效率，可以在執行到該語句前，把不需要的記錄過濾掉。

反例：

select job，avg（salary） from employee  group by job having job ='president' or job = 'managent';

正例：

select job，avg（salary） from employee where job ='president' or job = 'managent' group by job;

29、如果欄位型別是字串，where時一定用引號括起來，否則索引失效。

反例：

select * from user where userid =123;

正例：

select * from user where userid ='123';

理由：

為什麼第一條語句未加單引號就不走索引了呢？這是因為不加單引號時，是字串跟數字的比較，它們型別不匹配，MySQL會做隱式的型別轉換，把它們轉換為浮點數再做比較。

30、使用explain分析你SQL的計劃。

日常開發寫SQL的時候，儘量養成一個習慣吧。用explain分析一下你寫的SQL，尤其是走不走索引這一塊。

explain select * from user where userid =10086 or age =18;

本作品採用《CC 協議》，轉載必須註明作者和本文連結

後端程式設計師必備：書寫高質量SQL的30條建議
2020-03-21
後端程式設計師SQL
書寫高質量sql的一些建議
2022-02-18
SQL
程式設計師必備基礎：改善Java程式的20個實用建議
2021-10-22
程式設計師Java
給程式設計師“菜鳥”的6條建議
2018-03-23
程式設計師
我總結了寫出高質量程式碼的12條建議
2023-01-25
程式設計師必備裝備！
2019-05-07
程式設計師
#給java程式設計師的10條建議，吐血推薦！
2018-12-14
Java程式設計師
1024 寫給程式設計師的一些建議
2021-10-27
程式設計師
程式設計師必備的表情包
2018-11-28
程式設計師
程式設計師必讀的30本非技術書（文末福利）
2018-09-05
程式設計師
程式設計師跳槽必備神器
2019-12-10
程式設計師
Java程式設計師必備技能
2020-11-07
Java程式設計師
【備戰春招/秋招系列】Java程式設計師必備書單
2018-11-14
Java程式設計師
【轉】程式設計師必備的程式碼審查（Code Review）清單
2018-10-16
程式設計師View
給程式設計師的幾點程式設計經驗----《編寫高質量程式碼》
2020-04-05
程式設計師
程式設計師學習必備書單彙總，超全！
2020-10-24
程式設計師
編寫高質量程式碼改善Python程式的91個建議
2018-10-07
Python
程式設計師寫的跳轉
2019-05-11
程式設計師
這十五本Python書籍！是每個程式設計師必備的！
2018-12-19
Python程式設計師
程式設計師必備的 chrome 外掛及下載安裝
2019-10-23
程式設計師Chrome
老程式設計師的10個程式設計小技巧，教你寫出高質量程式碼！
2020-02-10
程式設計師
關於要不要轉行做程式設計師的建議
2020-07-09
程式設計師
Java程式設計師必備的Intellij外掛
2018-10-09
Java程式設計師IntelliJ
Git算不算程式設計師的必備技能？
2018-04-26
Git程式設計師
程式設計師大牛必備的英文詞彙
2018-05-28
程式設計師
Java程式設計師必備的工具和框架
2022-03-22
Java程式設計師框架
這些資深程式設計師的程式設計小技巧，教你寫出高質量程式碼！
2019-11-04
程式設計師
程式設計師必備：30個MySQL資料庫常用小技巧，值得收藏！
2018-12-03
程式設計師MySql資料庫
戰神系列戰鬥設計師：給遊戲設計師的 50 條建議
2023-12-28
遊戲設計師
總結 90 條寫 Python 程式的建議
2020-05-27
Python
創業者，程式設計師必備神器
2019-02-28
創業程式設計師
Linux系統——程式設計師跳槽必備
2018-11-29
Linux程式設計師
(效率人生)程式設計師必備工具Dash
2018-06-14
程式設計師
程式設計師必備能力——晉升之道
2020-10-29
程式設計師
新手程式設計師必備10大技能
2021-07-14
程式設計師
《編寫高質量程式碼：改善Java程式的151個建議》筆記
2018-10-10
Java筆記
拿萬元月薪必備的書單，學JAVA的程式設計師必看的5本書！
2020-05-21
Java程式設計師
程式設計師必備技能-科學砍需求
2019-01-17
程式設計師