資料庫表表面上存在索引和防錯機制，然而一個簡單的查詢就會耗費很長時間。Web應用程式或許在開發環境中執行良好，但在產品環境中表現同樣糟糕。如果你是個資料庫管理員，你很有可能已經在某個階段遇到上述情況。因此，本文將介紹對MySQL進行效能最佳化的技巧和竅門。

1.儲存引擎的選擇
如果資料表需要事務處理，應該考慮使用InnoDB，因為它完全符合ACID特性。如果不需要事務處理，使用預設儲存引擎MyISAM是比較明智的。並且不要嘗試同時使用這兩個儲存引擎。思考一下：在一個事務處理中，一些資料表使用InnoDB，而其餘的使用MyISAM。結果呢?整個subject將被取消，只有那些在事務處理中的被帶回到原始狀態，其餘的被提交的資料轉存，這將導致整個資料庫的衝突。然而存在一個簡單的方法可以同時利用兩個儲存引擎的優勢。目前大多數MySQL套件中包括InnoDB、編譯器和連結串列，但如果你選擇MyISAM，你仍然可以單獨下載InnoDB，並把它作為一個外掛。很簡單的方法，不是嗎?

2.計數問題
如果資料表採用的儲存引擎支援事務處理(如InnoDB)，你就不應使用COUNT(*)計算資料表中的行數。這是因為在產品類資料庫使用COUNT(*)，最多返回一個近似值，因為在某個特定時間，總有一些事務處理正在執行。如果使用COUNT(*)顯然會產生bug，出現這種錯誤結果。

3.反覆測試查詢
查詢最棘手的問題並不是無論怎樣小心總會出現錯誤，並導致bug出現。恰恰相反，問題是在大多數情況下bug出現時，應用程式或資料庫已經上線。的確不存在針對該問題切實可行的解決方法，除非將測試樣本在應用程式或資料庫上執行。任何資料庫查詢只有經過上千個記錄的大量樣本測試，才能被認可。

4.避免全表掃描
通常情況下，如果MySQL(或者其他關聯式資料庫模型)需要在資料表中搜尋或掃描任意特定記錄時，就會用到全表掃描。此外，通常最簡單的方法是使用索引表，以解決全表掃描引起的低效能問題。然而，正如我們在隨後的問題中看到的，這存在錯誤部分。

5.使用”EXPLAIN”進行查詢
當需要除錯時，EXPLAIN是一個很好的命令，下面將對EXPLAIN進行深入探討。
首先，建立一個簡單的資料表：
複製程式碼程式碼如下:
CREATETABLE'awesome_pcq'(
'emp_id'INT(10)NOTNULL
DEFAULT'0',
'full_name'VARCHAR(100)NOTNULL,
'email_id'VARCHAR(100)NOTNULL,
'password'VARCHAR(50)NOTNULL,
'deleted'TINYINT(4)NOTNULL,
PRIMARYKEY('emp_id')
) COLLATE='utf8_general_ci'
ENGINE=InnoDB
ROW_FORMAT=DEFAULT

這個資料表一目瞭然，共有五列，最後一列“deleted”是一個Boolean類變數flag來檢查帳號是活動的還是已被刪除。接下來，您需要用樣本記錄填充這個表(比如，100個僱員記錄)。正如你看到的，主鍵是“emp_id”。因此，使用電子郵件地址和密碼欄位，我們可以很容易地建立一個查詢，以驗證或拒絕登入請求，如下(例項一)：
複製程式碼程式碼如下:
SELECTCOUNT(*)FROMawesome_pcqWHERE
email_id='blahblah'ANDpassword='blahblah'ANDdeleted=0

之前我們提到，要避免使用COUNT(*)。程式碼糾正如下(例項二)：
複製程式碼程式碼如下:
SELECTemp_idFROMawesome_pcqWHERE
email_id='blahblah'ANDpassword='blahblah'ANDdeleted=0

現在回想一下，在例項一中，程式碼查詢定位並返回“email_id”和“password”等於給定值的行數。在例項二中，進行了同樣的查詢，不同的是明確要求列出“emp_id”所有滿足給定的標準的值。哪個查詢更費時?
很顯然，這兩個例項都是同樣費時的資料庫查詢，因為無意間，兩個例項查詢都進行了全表掃描。為了更好地讀懂指令，執行如下程式碼：
複製程式碼程式碼如下:
EXPLAINSELECTemp_idFROMawesome_pcqWHERE
email_id='blahblah'ANDpassword='blahblah'ANDdeleted=0

在輸出時，集中在倒數第二列：“rows”。假設我們已經將表填充了100個記錄，它會在第一行顯示100，這是MySQL需要進行掃描用來計算查詢的結果的行數。這說明了什麼?這需要全表掃描。為了克服這個弊端，則需要新增索引。

6.新增索引
先從重要的說起：給每一個可能遇到的次要問題建立索引並不明智。過多的索引會導致效能減慢和資源佔用。在進一步討論之前，在例項中建立一個樣本索引：
複製程式碼程式碼如下:
ALTERTABLE'awesome_pcq'ADDINDEX'LoginValidate'('email_id')

接下來，再次執行該查詢：
複製程式碼程式碼如下:
EXPLAINSELECTemp_idFROMawesome_pcqWHERE
email_id='blahblah'ANDpassword='blahblah'ANDdeleted=0

請注意執行後的值。不是100，而是1。因此，為了給出查詢結果，MySQL只掃描了1行，多虧先前建立的索引。你可能會注意到，索引只在電子郵件地址欄位建立，而查詢對其他欄位同樣進行了搜尋。這表明MySQL先執行了一個cros-check，檢查是否有在WHERE子句中的定義的值有索引指定，如果有這樣的值就執行相應的操作。

但是，它不是每次重複將減少到一個。例如，如果不是唯一的索引欄位(如employee names列可以有兩行相同的值)，即使建立索引，也將有多個記錄留下。但它仍然比全表掃描好。並且，在WHERE子句中指定列的順序沒有在這個過程中發揮作用。例如，如果在上面的查詢中，改變欄位的順序，使電子郵件地址出現在最後，MySQL仍將遍歷索引列的基礎上。那麼，就要在索引上動腦筋，注意如何避免大量的全表掃描，並獲得更好的結果。不過，這需要經歷一個很長的過程。

解析MySQL資料庫效能最佳化的六大技巧

相關文章