MySQL查詢最佳化的5個實用技巧

coyan發表於2021-09-09

本文總結分析了MySQL查詢最佳化的技巧。分享給大家供大家參考,具體如下:

熟悉SQL語句的人都清楚,如果要對一個任務進行操作的話,SQL語句可以有很多種相關寫法,但是不同的寫法查詢的效能可能會有天壤之別。

本文列舉出五個MySQL查詢最佳化的方法,當然,最佳化的方法還有很多。

1、最佳化資料型別

MySQL中資料型別有多種,如果你是一名DBA,正在按照最佳化的原則對資料型別進行嚴格的檢查,但開發人員可能會選擇他們認為最簡單的方案,以加快編碼速度,或者選擇最明顯的選擇,因此,你可能面臨的都不是最佳的選擇,如果可能的話,你應該嘗試以通用準則來改變這些決定。

(1)避免使用NULL

NULL對於大多數資料庫都需要特殊處理,MySQL也不例外,它需要更多的程式碼,更多的檢查和特殊的索引邏輯,有些開發人員完全沒有意識到,建立表時NULL是預設值,但大多數時候應該使用NOT NULL,或者使用一個特殊的值,如0,-1作為預設值。

(2)僅可能使用更小的欄位

MySQL從磁碟讀取資料後是儲存到記憶體中的,然後使用cpu週期和磁碟I/O讀取它,這意味著越小的資料型別佔用的空間越小,從磁碟讀或打包到記憶體的效率都更好,但也不要太過執著減小資料型別,要是以後應用程式發生什麼變化就沒有空間了。修改表將需要重構,間接地可能引起程式碼的改變,這是很頭疼的問題,因此需要找到一個平衡點。

2、小心字符集轉換

客戶端或應用程式使用的字符集可能和表本身的字符集不一樣,這需要MySQL在執行過程中隱含地進行轉換,此外,要確定字符集如UTF-8是否支援多位元組字元,因此它們需要更多的儲存空間。

3、最佳化count(my_col)和count(*)

如果你使用MyISAM表,在沒有where子句的情況下使用count(*)速度是很快的,因為行數量的統計是非常精確的,因此MySQL不會一行一行地去找,進而得出行數,如my_col列沒有空值,那麼和前面說的情況會一樣,即count(my_col)速度也會很快。

如果有where子句時使用count( ),基本上就無法進行更多最佳化了,在where子句中超出了明顯的索引列,對於複雜的where子句,只有使用覆蓋索引才有用。

除了上面的建議外,你還可以使用匯總表,它們讓你可以對錶的內容保持更新,你可以使用觸發器,或者應用程式邏輯保持彙總表總是最新狀態,或者定期執行一個批處理作業保持填充最新的資料資訊,如果你採用後者,你的資訊將會非常接近,但不是精確的,依賴於批處理作業多久執行一次,這需要權衡應用程式對精確資訊的需要,和保持資料更新的系統開銷,要在這二者之間找到一個平衡點。

4、最佳化子查詢

遇到子查詢時,MySQL查詢最佳化引擎並不是總是最有效的,這就是為什麼經常將子查詢轉換為連線查詢的原因了,最佳化器已經能夠正確處理連線查詢了,當然要注意的一點是,確保連線表(第二個表)的連線列是有索引的,在第一個表上MySQL通常會相對於第二個表的查詢子集進行一次全表掃描,這是巢狀迴圈演算法的一部分。

5、最佳化UNION

在跨多個不同的資料庫時使用UNION是一個有趣的最佳化方法,UNION從兩個互不關聯的表中返回資料,這就意味著不會出現重複的行,同時也必須對資料進行排序,我們知道排序是非常耗費資源的,特別是對大表的排序。

UNION ALL可以大大加快速度,如果你已經知道你的資料不會包括重複行,或者你不在乎是否會出現重複的行,在這兩種情況下使用UNION ALL更適合。此外,還可以在應用程式邏輯中採用某些方法避免出現重複的行,這樣UNION ALL和UNION返回的結果都是一樣的,但UNION ALL不會進行排序。

小結

雖然本文列舉的最佳化方法並不完全,但無論何時,只要可能,儘可能嘗試不同的解決方案,檢視查詢計劃,在大資料集上進行測試,並會定位結果基準點,觀察在實際應用中的情況怎麼樣。同時,事先檢視一下你的慢速查詢日誌,儘可能早地找出需要調整的查詢。

希望本文所述對大家MySQL資料庫程式設計有所幫助。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/2236/viewspace-2811048/,如需轉載,請註明出處,否則將追究法律責任。

相關文章