sql中in和exists的原理及使用場景。

潘超go發表於2019-06-20

原文網址 : https://www.cnblogs.com/573734817pc/p/11057677.html

在我們的工作中可能會遇到這樣的情形：

我們需要查詢a表裡面的資料，但是要以b表作為約束。

舉個例子，比如我們需要查詢訂單表中的資料，但是要以使用者表為約束，也就是查詢出來的訂單的user_id要在使用者表裡面存在才返回。

表結構和表資料如下：

table1 usertb;
+-------+-------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+-------+-------------+------+-----+---------+----------------+
| id | int(11) | NO | PRI | NULL | auto_increment |
| name | varchar(30) | YES | | NULL | |
+-------+-------------+------+-----+---------+----------------+
+----+-----------+
| id | name |
+----+-----------+
| 1 | panchao |
| 2 | tangping |
| 3 | yinkaiyue |
+----+-----------+

table2 ordertb;
+------------+-------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+------------+-------------+------+-----+---------+----------------+
| id | int(11) | NO | PRI | NULL | auto_increment |
| user_id | int(11) | YES | | NULL | |
| order_name | varchar(50) | YES | | NULL | |
+------------+-------------+------+-----+---------+----------------+
+----+---------+-------------------+
| id | user_id | order_name |
+----+---------+-------------------+
| 1 | 1 | tangping's order |
| 2 | 2 | yinkaiyue's order |
| 3 | 0 | zhangtian's order |
+----+---------+-------------------+

看過表過後，大家在腦海中可能已經想出了很多方法了，對吧。

主要三種方法：left join、in、exists。

我們分別來看看。他們的查詢結果和explain的結果。

1、left join：

MariaDB [test]> select * from ordertb a left join usertb b on a.user_id = b.id;
+----+---------+-------------------+------+----------+
| id | user_id | order_name | id | name |
+----+---------+-------------------+------+----------+
| 1 | 1 | tangping's order | 1 | panchao |
| 2 | 2 | yinkaiyue's order | 2 | tangping |
| 3 | 0 | zhangtian's order | NULL | NULL |
+----+---------+-------------------+------+----------+
MariaDB [test]> explain select * from ordertb a left join usertb b on a.user_id= b.id;
+------+-------------+-------+--------+---------------+---------+---------+----------------+------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+------+-------------+-------+--------+---------------+---------+---------+----------------+------+-------------+
| 1 | SIMPLE | a | ALL | NULL | NULL | NULL | NULL | 3 | |
| 1 | SIMPLE | b | eq_ref | PRIMARY | PRIMARY | 4 | test.a.user_id | 1 | Using where |
+------+-------------+-------+--------+---------------+---------+---------+----------------+------+-------------+

2、in：

3、exists：

我們可以看到，這三種查詢的explain結果大致相同，唯一不同的是left join中的Extra沒有用到Useing Where。說明left join相比於其他兩個查詢效率要低一些，並且left join中有冗餘資料。

我們再來看 in 和 exists ，從表面上來看好像xiaolv一樣。其實不然。我們來深入分析一下這兩個語句。

1、in。

其中usertb我們用B來代替，ordertb我們用A來代替。

in()只執行一次,它查出B表中的所有id欄位並快取起來.之後,檢查A表的user_id是否與B表中的id相等,如果相等則將A表的記錄加入結果集中,直到遍歷完A表的所有記錄. 它的查詢過程類似於以下過程

List resultSet=[]; Array A=(select * from A); Array B=(select id from B);
for(int i=0;i<A.length;i++) { for(int j=0;j<B.length;j++) { if(A[i].id==B[j].id) { resultSet.add(A[i]); break; } } } return resultSet;

可以看出,當B表資料較大時不適合使用in(),因為它會B表資料全部遍歷一次. 如:A表有10000條記錄,B表有1000000條記錄,那麼最多有可能遍歷10000*1000000次,效率很差. 再如:A表有10000條記錄,B表有100條記錄,那麼最多有可能遍歷10000*100次,遍歷次數大大減少,效率大大提升.

2、exists。

exists()會執行A.length次,它並不快取exists()結果集,因為exists()結果集的內容並不重要,重要的是結果集中是否有記錄,如果有則返回true,沒有則返回false. 它的查詢過程類似於以下過程

List resultSet=[]; Array A=(select * from A)
for(int i=0;i<A.length;i++) { if(exists(A[i].id) { //執行select 1 from B b where b.id=a.id是否有記錄返回 resultSet.add(A[i]); } } return resultSet;

當B表比A表資料大時適合使用exists(),因為它沒有那麼遍歷操作,只需要再執行一次查詢就行. 如:A表有10000條記錄,B表有1000000條記錄,那麼exists()會執行10000次去判斷A表中的id是否與B表中的id相等. 如:A表有10000條記錄,B表有100000000條記錄,那麼exists()還是執行10000次,因為它只執行A.length次,可見B表資料越多,越適合exists()發揮效果. 再如:A表有10000條記錄,B表有100條記錄,那麼exists()還是執行10000次,還不如使用in()遍歷10000*100次,因為in()是在記憶體裡遍歷比較,而exists()需要查詢資料庫,我們都知道查詢資料庫所消耗的效能更高,而記憶體比較很快.

結論:exists()適合B表比A表資料大的情況

當A表資料與B表資料一樣大時,in與exists效率差不多,可任選一個使用.

區別及應用場景

in 和 exists的區別:

如果子查詢得出的結果集記錄較少，主查詢中的表較大且又有索引時應該用in, 反之如果外層的主查詢記錄較少，子查詢中的表大，又有索引時使用exists。其實我們區分in和exists主要是造成了驅動順序的改變(這是效能變化的關鍵)，如果是exists，那麼以外層表為驅動表，先被訪問，如果是IN，那麼先執行子查詢，所以我們會以驅動表的快速返回為目標，那麼就會考慮到索引及結果集的關係了，另外IN時不對NULL進行處理。

in 是把外表和內表作hash 連線，而exists是對外表作loop迴圈，每次loop迴圈再對內表進行查詢。一直以來認為exists比in效率高的說法是不準確的。

更多細節，可以參考以下部落格（SQL語句中exists和in的區別），因為我也是看了這個部落格寫的文章。

Oralce 使用SQL中的exists 和not exists 用法詳解
2020-12-17
SQL
In和exists使用及效能分析(二)：exists的使用
2019-03-19
面試中的 ThreadLocal 原理和使用場景
2019-07-27
面試thread
In和exists使用及效能分析(三)：in和exists的效能分析
2019-07-03
[精選] SQL中的IN與NOT IN、EXISTS與NOT EXISTS的區別及效能分析
2021-11-03
SQL
Mybatis-Plus的應用場景及注入SQL原理分析
2021-05-25
MyBatisSQL
ThreadLocal 原理和使用場景分析
2018-04-02
thread
In和exists使用及效能分析(一)：in的使用
2019-06-04
Hbase原理的介紹和使用場景分析
2019-02-15
對線面試官：SQL中的IN與NOT IN、EXISTS與NOT EXISTS的區別及效能分析
2021-11-03
面試SQL
G1與CMS各自的使用場景及原理
2020-11-19
一文弄懂分散式場景中各種鎖的原理及使用
2020-12-14
分散式
Webpack 下使用 web workers 及基本原理和應用場景
2019-07-27
Web
ArrayList和LinkedList底層原理的區別和使用場景
2024-03-14
JS的節流、函式防抖原理及使用場景
2018-09-10
JS函式
metersphere 介面自動化中sql場景使用
2024-08-27
SQL
SQL語句中exists和in的區別
2021-04-28
SQL
ZooKeeper核心原理及應用場景
2020-06-09
說一說V-Layout框架的原理和使用場景
2019-02-28
框架
非同步神器：CompletableFuture實現原理和使用場景
2022-02-20
非同步
Java中的引用型別和使用場景
2021-10-07
Java型別
python中 _、__、__xx__() 區別及使用場景
2020-06-29
Python
【進階3-3期】深度解析 call 和 apply 原理、使用場景及實現
2018-12-04
APP
海外IP池的工作原理及應用場景
2023-05-15
sql：delete if exists還是drop if exists?
2024-03-13
SQLdelete
HDFS應用場景、原理、基本架構及使用方法概述
2018-10-23
架構
Python中lambda表示式的優缺點及使用場景
2018-10-31
Python
Redis 中 HyperLogLog 的使用場景
2020-10-13
Redis
Redis 中 BitMap 的使用場景
2020-10-12
Redis
併發容器的原理，七大併發容器詳解、及使用場景
2021-09-09
memcached 和 redis 使用場景及優缺點對比
2018-08-13
Redis
js中call,apply和bind方法的區別和使用場景
2020-10-25
JSAPP
JavaScript 工作原理之七－Web Workers 分類及 5 個使用場景
2019-02-16
JavaScriptWeb
Java程式中的代理作用和應用場景及實現
2021-04-03
Java
MySQL資料SQL優化中，索引不被使用的典型場景總結
2018-08-12
MySql優化索引
useCallback 和 useMemo 使用場景
2024-11-15
MySQL和Elasticsearch使用場景
2024-10-22
MySqlElasticsearch
Java動態代理—框架中的應用場景和基本原理
2020-11-22
Java框架

sql中in和exists的原理及使用場景。

區別及應用場景

相關文章