【MySQL】order by 結果不準確的問題及解決

風塵_NULL發表於2017-02-06
一 介紹 
  相信作為DBA 在和開發打交道的過程中,經常會遇到分頁查詢 order by 排序這樣的需求。本文源於生產過程中的案例,5.6版本的資料庫使用limit和order by 一個非唯一欄位時,結果集並不總是確定的.已經確定為bug,詳見: 
提醒讀者朋友注意。
二 分析 
環境準備 
  1. CREATE TABLE `tb1` (
  2.   `id` bigint(20) NOT NULL AUTO_INCREMENT,
  3.   `a` decimal(19,2) NOT NULL,
  4.   `acid` bigint(20) NOT NULL,
  5.   `prid` bigint(20) NOT NULL,
  6.   PRIMARY KEY (`id`),
  7.   KEY `idx_prid` (`prid`),
  8.   KEY `idx_acid` (`acid`)
  9. ) ENGINE=InnoDB AUTO_INCREMENT=0 DEFAULT CHARSET=utf8
注意欄位a 上面是沒有索引的。
初始化資料
  1. INSERT INTO `tb1` (`id`, `a`, `acid`, `prid`)
  2. VALUES (1,2.00,3,2),(2,3.00,3,2),(3,4.00,2,3),(4,5.00,2,3),(5,6.00,2,3),(6,8.00,2,3),(7,10.00,2,3),(8,12.00,2,3),(9,16.00,2,3),(10,20.00,2,3),(11,6.00,2,4),(12,8.00,2,4),(13,10.00,2,4),(14,12.00,2,4),(15,5.00,2,2),(16,6.00,2,2);
執行兩個 根據非索引欄位且有重複值的 order by 排序
  1. mysql> select * from tb1 order by a desc limit 4;
  2. +----+-------+------+------+
  3. | id | a     | acid | prid |
  4. +----+-------+------+------+
  5. | 10 | 20.00 | 2    | 3    |
  6. | 9  | 16.00 | 2    | 3    |
  7. | 14 | 12.00 | 2    | 4    |
  8. | 8  | 12.00 | 2    | 3    |
  9. +----+-------+------+------+
  10. 4 rows in set (0.00 sec)
得到id 為10, 9, 14, 8 的結果集
  1. mysql> select * from tb1 order by a desc limit 3;
  2. +----+-------+------+------+
  3. | id | a     | acid | prid |
  4. +----+-------+------+------+
  5. | 10 | 20.00 | 2    | 3    |
  6. | 9  | 16.00 | 2    | 3    |
  7. | 8  | 12.00 | 2    | 3    |
  8. +----+-------+------+------+
  9. 3 rows in set (0.00 sec)
得到id 為10 9 8 的結果集
為a欄位加上索引 
  1. mysql> alter table tb1 add key ind_tb1a(a);
  2. Query OK, 0 rows affected (0.00 sec)
  3. Records: 0 Duplicates: 0 Warnings: 0
  4. mysql> select * from tb1 order by a desc limit 3;
  5. +----+-------+------+------+
  6. | id | a     | acid | prid |
  7. +----+-------+------+------+
  8. | 10 | 20.00 | 2    | 3    |
  9. | 9  | 16.00 | 2    | 3    |
  10. | 8  | 12.00 | 2    | 3    |
  11. +----+-------+------+------+
  12. 3 rows in set (0.00 sec)
得到id 為10 9 8 的結果集
  1. mysql> select * from tb1 order by a desc limit 4;
  2. +----+-------+------+------+
  3. | id | a     | acid | prid |
  4. +----+-------+------+------+
  5. | 10 | 20.00 | 2    | 3    |
  6. | 9  | 16.00 | 2    | 3    |
  7. | 14 | 12.00 | 2    | 4    |
  8. | 8  | 12.00 | 2    | 3    |
  9. +----+-------+------+------+
  10. 4 rows in set (0.00 sec)
得到id 為10, 9, 14, 8 的結果集
從上面的測試來看對於一個非唯一欄位 無論是否含有索引,結果集都是不確定的。

三 解決方法 
1 業務屬性確保 a 欄位不能唯一,則需要針對排序結果再加上 一個唯一欄位的排序 比如id 
  1. mysql> select * from tb1 order by a desc ,id desc limit 4;
  2. +----+-------+------+------+
  3. | id | a     | acid | prid |
  4. +----+-------+------+------+
  5. | 10 | 20.00 | 2    | 3    |
  6. | 9  | 16.00 | 2    | 3    |
  7. | 14 | 12.00 | 2    | 4    |
  8. | 8  | 12.00 | 2    | 3    |
  9. +----+-------+------+------+
  10. 4 rows in set (0.00 sec)
  1. mysql> select * from tb1 order by a desc ,id desc limit 3;
  2. +----+-------+------+------+
  3. | id | a     | acid | prid |
  4. +----+-------+------+------+
  5. | 10 | 20.00 | 2    | 3    |
  6. | 9  | 16.00 | 2    | 3    |
  7. | 14 | 12.00 | 2    | 4    |
  8. +----+-------+------+------+
  9. 3 rows in set (0.00 sec)
使用order by id/unique_key 排序之後,前三個結果集是一致的10,9,14 。 結果集滿足我們的需求。從而解決不確定性帶來的問題。
2 是否可以去掉不必要的order by,這個是由業務邏輯決定的。

四 總結
  DBA在和開發溝通/培訓過程中要注意這一點 基於非唯一欄位的排序 結果集是不確定的。如果業務邏輯對分頁或者order by結果集有比較高的嚴格要求 ,請記得利用唯一鍵排序。 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/30221425/viewspace-2133112/,如需轉載,請註明出處,否則將追究法律責任。

相關文章