Mysql取隨機資料效率測試(400W條中讀取100條)

OldBoy~發表於2017-05-17

測試資料表的建立在文章:http://www.cnblogs.com/wt645631686/p/6868192.html

先看一下我的SQL方案

SELECT * FROM `emp` WHERE `empno` >=(SELECT FLOOR(RAND() * ((SELECT MAX(empno) FROM `emp`) -
(SELECT MIN(empno) FROM `emp`)) + (SELECT MIN(empno) FROM `emp`))) LIMIT 100

 

在終端中測試結果是0.01sec.

在Mysql工具中測試結果是0.008-0.01sec。

看一下我在網上找到方案:

第一種方案:

SELECT * 
FROM `emp` AS t1 JOIN (SELECT ROUND(RAND() * ((SELECT MAX(empno) FROM `emp`)-(SELECT MIN(empno) FROM `emp`))+
(SELECT MIN(empno) FROM `emp`)) AS empno) AS t2 
WHERE t1.empno >= t2.empno 
ORDER BY t1.empno LIMIT 100;

在終端中測試結果是0.00sec.

在Mysql工具中測試結果是0.001-0.003sec。

第二種方案:

SELECT * FROM `emp` 
WHERE empno >= (SELECT floor(RAND() * (SELECT MAX(empno) FROM `emp`)))  
ORDER BY empno LIMIT 100;

在終端中測試結果是0.01-0.02sec.

在Mysql工具中測試結果是0.014-0.016sec。

第三種方案:

SELECT * FROM `emp` 
WHERE empno >= (SELECT floor( RAND() * ((SELECT MAX(empno) FROM `emp`)-(SELECT MIN(empno) FROM `emp`)) + 
(SELECT MIN(empno) FROM `emp`)))  
ORDER BY empno LIMIT 100;

在終端中多次測試,由0.2sec最高,到最終結果是0.10-0.14sec,這是因為Mysql的查詢快取起到了作用。

在Mysql工具中測試結果是0.125-0.289sec。

最終第一種方案勝出,得出結論:採用JOIN的語法比直接在WHERE中使用函式效率還要高很多。

具體原因大家自己用EXPLAIN或者DESC,PROFILING工具分析一下。

相關文章