[轉載] 為什麼 MySQL 不推薦使用子查詢和 join

Ellen_Yeager發表於2019-01-01

1.對於mysql,不推薦使用子查詢和join是因為本身join的效率就是硬傷,一旦資料量很大效率就很難保證,強烈推薦分別根據索引單表取資料,然後在程式裡面做join,merge資料。

2.子查詢就更別用了,效率太差,執行子查詢時,MYSQL需要建立臨時表,查詢完畢後再刪除這些臨時表,所以,子查詢的速度會受到一定的影響,這裡多了一個建立和銷燬臨時表的過程。

3.如果是JOIN的話,它是走巢狀查詢的。小表驅動大表,且透過索引欄位進行關聯。如果表記錄比較少的話,還是OK的。大的話業務邏輯中可以控制處理。

4.資料庫是最底層的,瓶頸往往是資料庫。建議資料庫只是作為資料store的工具,而不要新增業務上去。

一、應用層關聯的優勢:

讓快取的效率更高。許多應用程式可以方便地快取單表查詢對應的結果物件。如果關聯中的某個表發生了變化,那麼就無法使用查詢快取了,而拆分後,如果某個表很少改變,那麼基於該表的查詢就可以重複利用查詢快取結果了。
將查詢分解後,執行單個查詢可以減少鎖的競爭。
在應用層做關聯,可以更容易對資料庫進行拆分,更容易做到高效能和可擴充套件。
查詢本身效率也可能會有所提升。查詢id集的時候,使用IN()代替關聯查詢,可以讓MySQL按照ID順序進行查詢,這可能比隨機的關聯要更高效。
可以減少冗餘記錄的查詢。在應用層做關聯查詢,意味著對於某條記錄應用只需要查詢一次,而在資料庫中做關聯查詢,則可能需要重複地訪問一部分資料。從這點看,這樣的重構還可能會減少網路和記憶體的消豔。
更進一步,這樣做相當於在應用中實現了雜湊關聯,而不是使用MySQL的巢狀迴圈關聯。某些場景雜湊關聯的效率要高很多。
二、應用層關聯的使用場景:

當應用能夠方便地快取單個查詢的結果的時候
當可以將資料分佈到不同的MySQL伺服器上的時候
當能夠使用IN()的方式代替關聯查詢的時候
併發場景多,DB查詢頻繁,需要分庫分表
三、不推薦使用join的原因: 

1.DB承擔的業務壓力大,能減少負擔就減少。當表處於百萬級別後,join導致效能下降; 

2.分散式的分庫分表。這種時候是不建議跨庫join的。目前mysql的分散式中介軟體,跨庫join表現不良。 

3.修改表的schema,單表查詢的修改比較容易,join寫的sql語句要修改,不容易發現,成本比較大,當系統比較大時,不好維護。

四、不使用join的解決方法: 

在業務層,單表查詢出資料後,作為條件給下一個單表查詢。也就是子查詢。 會擔心子查詢出來的結果集太多。mysql對in的數量沒有限制,但是mysql限制整條sql語句的大小。透過調整引數max_allowed_packet ,可以修改一條sql的最大值。建議在業務上做好處理,限制一次查詢出來的結果集是能接受的。

五、再來說說join查詢的好處:

1.做分頁查詢:

關聯查詢的好處時候可以做分頁,可以用副表的欄位做查詢條件,在查詢的時候,將副表匹配到的欄位作為結果集,用主表去in它,但是問題來了,如果匹配到的資料量太大就不行了,也會導致返回的分頁記錄跟實際的不一樣,解決的方法可以交給前端,一次性查詢,讓前端分批顯示就可以了,這種解決方案的前提是資料量不太,因為sql本身長度有限。


作者:大頭大頭編碼不愁
來源:CSDN
原文:https://blog.csdn.net/weixin_38676357/arti...
版權宣告:本文為博主原創文章,轉載請附上博文連結!

本作品採用《CC 協議》,轉載必須註明作者和本文連結

相關文章