MySQL大資料量快速插入方法和語句優化

發表於2015-04-02

MySql大資料優化

MySQL大資料量快速插入方法和語句優化是本文我們主要要介紹的內容，接下來我們就來一一介紹，希望能夠對您有所收穫！

INSERT語句的速度

插入一個記錄需要的時間由下列因素組成，其中的數字表示大約比例：

連線：（3）

傳送查詢給伺服器：（2）

分析查詢：（2）

插入記錄：（1x記錄大小）

插入索引：（1x索引）

關閉：（1）

這不考慮開啟表的初始開銷，每個併發執行的查詢開啟。

表的大小以logN （B樹）的速度減慢索引的插入。

加快插入的一些方法：

如果同時從同一個客戶端插入很多行，使用含多個VALUE的INSERT語句同時插入幾行。這比使用單行INSERT語句快（在某些情況下快幾倍）。如果你正向一個非空表新增資料，可以調節bulk_insert_buffer_size變數，使資料插入更快。

如果你從不同的客戶端插入很多行，能通過INSERT DELAYED語句加快速度。

用MyISAM，如果在表中沒有刪除的行，能在SELECT語句正在執行的同時插入行。

當從一個文字檔案裝載一個表時，使用LOAD DATA INFILE。這通常比使用很多INSERT語句快20倍。參見13.2.5節，“LOAD DATA INFILE語法”。

當表有很多索引時，有可能要多做些工作使得LOAD DATA INFILE更快些。使用下列過程：

有選擇地用CREATE TABLE建立表。

執行FLUSH TABLES語句或命令mysqladmin flush-tables。使用myisamchk –keys-used=0 -rq /path/to/db/tbl_name。這將從表中取消所有索引的使用。

用LOAD DATA INFILE把資料插入到表中，因為不更新任何索引，因此很快。如果只想在以後讀取表，使用myisampack壓縮它。參見15.1.3.3節，“壓縮表特性”。

用myisamchk -r -q /path/to/db/tbl_name重新建立索引。這將在寫入磁碟前在記憶體中建立索引樹，並且它更快，因為避免了大量磁碟搜尋。結果索引樹也被完美地平衡。執行FLUSH TABLES語句或mysqladmin flush-tables命令。

請注意如果插入一個空MyISAM表，LOAD DATA INFILE也可以執行前面的優化；主要不同處是可以讓myisamchk為建立索引分配更多的臨時記憶體，比執行LOAD DATA INFILE語句時為伺服器重新建立索引分配得要多。

也可以使用ALTER TABLE tbl_name DISABLE KEYS代替myisamchk –keys-used=0 -rq/path/to/db/tbl_name，使用ALTER TABLE tbl_name ENABLE KEYS代替myisamchk -r -q/path/to/db/tbl_name。使用這種方式，還可以跳過FLUSH TABLES。

鎖定表可以加速用多個語句執行的INSERT操作：

LOCK TABLES a WRITE;
INSERT INTO a VALUES (1,23),(2,34),(4,33);
INSERT INTO a VALUES (8,26),(6,29);
UNLOCK TABLES;

LOCK TABLES a WRITE;

INSERT INTO a VALUES (1,23),(2,34),(4,33);

INSERT INTO a VALUES (8,26),(6,29);

UNLOCK TABLES;

這樣效能會提高，因為索引快取區僅在所有INSERT語句完成後重新整理到磁碟上一次。一般有多少INSERT語句即有多少索引快取區重新整理。如果能用一個語句插入所有的行，就不需要鎖定。

對於事務表，應使用BEGIN和COMMIT代替LOCK TABLES來加快插入。

鎖定也將降低多連線測試的整體時間，儘管因為它們等候鎖定最大等待時間將上升。例如：

Connection 1 does 1000 inserts 
Connections 2, 3, and 4 do 1 insert 
Connection 5 does 1000 inserts

Connection 1 does 1000 inserts

Connections 2, 3, and 4 do 1 insert

Connection 5 does 1000 inserts

如果不使用鎖定，2、3和4將在1和5前完成。如果使用鎖定，2、3和4將可能不在1或5前完成，但是整體時間應該快大約40%。

INSERT、UPDATE和DELETE操作在MySQL中是很快的，通過為在一行中多於大約5次連續不斷地插入或更新的操作加鎖，可以獲得更好的整體效能。如果在一行中進行多次插入，可以執行LOCK TABLES，隨後立即執行UNLOCK TABLES(大約每1000行)以允許其它的執行緒訪問表。這也會獲得好的效能。

INSERT裝載資料比LOAD DATA INFILE要慢得多，即使是使用上述的策略。

為了對LOAD DATA INFILE和INSERT在MyISAM表得到更快的速度，通過增加key_buffer_size系統變數來擴大鍵高速緩衝區。

INSERT語法

INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE] 
[INTO] tbl_name [(col_name,...)] 
VALUES ({expr | DEFAULT},...),(...),... 
[ ON DUPLICATE KEY UPDATE col_name=expr, ... ]

INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE]

[INTO] tbl_name [(col_name,...)]

VALUES ({expr | DEFAULT},...),(...),...

[ ON DUPLICATE KEY UPDATE col_name=expr, ... ]

或：

INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE] 
[INTO] tbl_name 
SET col_name={expr | DEFAULT}, ... 
[ ON DUPLICATE KEY UPDATE col_name=expr, ... ]

INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE]

[INTO] tbl_name

SET col_name={expr | DEFAULT}, ...

[ ON DUPLICATE KEY UPDATE col_name=expr, ... ]

或：

INSERT [LOW_PRIORITY | HIGH_PRIORITY] [IGNORE] 
[INTO] tbl_name [(col_name,...)] 
SELECT ... 
[ ON DUPLICATE KEY UPDATE col_name=expr, ... ]

INSERT [LOW_PRIORITY | HIGH_PRIORITY] [IGNORE]

[INTO] tbl_name [(col_name,...)]

SELECT ...

[ ON DUPLICATE KEY UPDATE col_name=expr, ... ]

一、DELAYED 的使用

使用延遲插入操作DELAYED調節符應用於INSERT和REPLACE語句。當DELAYED插入操作到達的時候，伺服器把資料行放入一個佇列中，並立即給客戶端返回一個狀態資訊，這樣客戶端就可以在資料表被真正地插入記錄之前繼續進行操作了。如果讀取者從該資料表中讀取資料，佇列中的資料就會被保持著，直到沒有讀取者為止。

接著伺服器開始插入延遲資料行（delayed-row）佇列中的資料行。在插入操作的同時，伺服器還要檢查是否有新的讀取請求到達和等待。如果有，延遲資料行佇列就被掛起，允許讀取者繼續操作。當沒有讀取者的時候，伺服器再次開始插入延遲的資料行。這個過程一直進行，直到佇列空了為止。

幾點要注意事項：

INSERT DELAYED應該僅用於指定值清單的INSERT語句。伺服器忽略用於INSERT DELAYED…SELECT語句的DELAYED。伺服器忽略用於INSERT DELAYED…ON DUPLICATE UPDATE語句的DELAYED。

因為在行被插入前，語句立刻返回，所以您不能使用LAST_INSERT_ID()來獲取AUTO_INCREMENT值。AUTO_INCREMENT值可能由語句生成。

對於SELECT語句，DELAYED行不可見，直到這些行確實被插入了為止。

DELAYED在從屬複製伺服器中被忽略了，因為DELAYED不會在從屬伺服器中產生與主伺服器不一樣的資料。注意，目前在佇列中的各行只儲存在儲存器中，直到它們被插入到表中為止。這意味著，如果您強行中止了mysqld(例如，使用kill -9)或者如果mysqld意外停止，則所有沒有被寫入磁碟的行都會丟失。

二、IGNORE的使用

IGNORE是MySQL相對於標準SQL的擴充套件。如果在新表中有重複關鍵字，或者當STRICT模式啟動後出現警告，則使用IGNORE控制ALTER TABLE的執行。

如果沒有指定IGNORE，當重複關鍵字錯誤發生時，複製操作被放棄，返回前一步驟。

如果指定了IGNORE，則對於有重複關鍵字的行，只使用第一行，其它有衝突的行被刪除。並且，對錯誤值進行修正，使之儘量接近正確值。insert ignore into tb(…) value(…)這樣不用校驗是否存在了，有則忽略，無則新增。

三、ON DUPLICATE KEY UPDATE的使用

如果您指定了ON DUPLICATE KEY UPDATE，並且插入行後會導致在一個UNIQUE索引或PRIMARY KEY中出現重複值，則執行舊行UPDATE。例如，如果列a被定義為UNIQUE，並且包含值1，則以下兩個語句具有相同的效果：

mysql> INSERT INTO table (a,b,c) VALUES (1,2,3) 
-> ON DUPLICATE KEY UPDATE cc=c+1; 
mysql> UPDATE table SET cc=c+1 WHERE a=1;

mysql> INSERT INTO table (a,b,c) VALUES (1,2,3)

-> ON DUPLICATE KEY UPDATE cc=c+1;

mysql> UPDATE table SET cc=c+1 WHERE a=1;

如果行作為新記錄被插入，則受影響行的值為1；如果原有的記錄被更新，則受影響行的值為2。

註釋：如果列b也是唯一列，則INSERT與此UPDATE語句相當：

mysql> UPDATE table SET cc=c+1 WHERE a=1 OR b=2 LIMIT 1;

1	mysql> UPDATE table SET cc=c+1 WHERE a=1 OR b=2 LIMIT 1;

如果a=1 OR b=2與多個行向匹配，則只有一個行被更新。通常，您應該儘量避免對帶有多個唯一關鍵字的表使用ON DUPLICATE KEY子句。您可以在UPDATE子句中使用VALUES(col_name)函式從INSERT…UPDATE語句的INSERT部分引用列值。換句話說，如果沒有發生重複關鍵字衝突，則UPDATE子句中的VALUES(col_name)可以引用被插入的col_name的值。本函式特別適用於多行插入。VALUES()函式只在INSERT…UPDATE語句中有意義，其它時候會返回NULL。

示例：

mysql> INSERT INTO table (a,b,c) VALUES (1,2,3),(4,5,6)

-> ON DUPLICATE KEY UPDATE c=VALUES(a)+VALUES(b);

mysql> INSERT INTO table (a,b,c) VALUES (1,2,3),(4,5,6)

-> ON DUPLICATE KEY UPDATE c=VALUES(a)+VALUES(b);

本語句與以下兩個語句作用相同：

mysql> INSERT INTO table (a,b,c) VALUES (1,2,3) 
-> ON DUPLICATE KEY UPDATE c=3; 
mysql> INSERT INTO table (a,b,c) VALUES (4,5,6) 
-> ON DUPLICATE KEY UPDATE c=9;

mysql> INSERT INTO table (a,b,c) VALUES (1,2,3)

-> ON DUPLICATE KEY UPDATE c=3;

mysql> INSERT INTO table (a,b,c) VALUES (4,5,6)

-> ON DUPLICATE KEY UPDATE c=9;

當您使用ON DUPLICATE KEY UPDATE時，DELAYED選項被忽略。

關於MySQL大資料量快速插入方法和語句優化的操作就介紹到這裡了，希望本次的介紹能夠對您有所收穫！

大資料量下MySQL插入方法的效能比較
2015-03-04
大資料MySql
mysql 語句的索引和優化
2016-12-09
MySql索引優化
淺談mysql配置優化和sql語句優化
2014-06-05
MySql優化
mysql大資料量分頁查詢方法及其優化
2017-05-27
MySql大資料優化
MYSQL SQL語句優化
2019-02-22
MySql優化
MySQL——優化ORDER BY語句
2018-10-31
MySql優化
mysql limit語句優化
2013-06-07
MySqlMIT優化
mysql 優化常用語句
2016-05-24
MySql優化
MySQL之SQL語句優化
2022-05-25
MySql優化
mysql 關於大資料量日誌表的優化過程
2017-04-05
MySql大資料優化
MySQL在大資料、高併發場景下的SQL語句優化和"最佳實踐"
2018-04-17
MySql大資料優化
MySQL系列6 - join語句的優化
2021-03-17
MySql優化
MySQL利用索引優化ORDER BY排序語句
2018-01-23
MySql索引優化排序
大資料量高併發的資料庫優化
2015-03-12
大資料資料庫優化
《MySQL慢查詢優化》之SQL語句及索引優化
2020-12-06
MySql優化索引
mysql 表資料量大量查詢慢如何優化
2021-03-08
MySql優化
資料庫效能優化之SQL語句優化
2016-01-05
資料庫優化SQL
優化SQL 語句 in 和not in 的替代方案
2010-03-02
優化SQL
SQL語句優化
2019-05-08
SQL優化
mysql千萬級資料量根據索引優化查詢速度
2018-05-08
MySql索引優化
MySql 學習筆記一：SQL語句優化
2016-10-04
MySql筆記優化
【MySQL】MySQL語句最佳化
2024-05-28
MySql
sql語句效能優化
2021-01-03
SQL優化
SQL語句的優化
2017-11-14
SQL優化
求助：SQL語句優化
2009-03-03
SQL優化
淺析MySQL語句優化中的explain引數
2019-03-03
MySql優化AI
Mysql 52條SQL語句效能優化策略彙總
2020-12-23
MySql優化
MySql常用30種SQL查詢語句優化方法
2018-03-23
MySql優化
MYSQL 大資料效能優化
2016-03-21
MySql大資料優化
SQL Server之資料庫語句優化
2016-01-11
SQLServer資料庫優化
SQL Server 之資料庫語句優化
2015-09-28
SQLServer資料庫優化
SQL Server優化之SQL語句優化
2016-01-12
SQLServer優化
Oracle學習系列—資料庫優化—Analyze語句和資料字典
2007-04-16
Oracle資料庫優化
1.4 資料庫和常用SQL語句（正文）——MySQL資料庫命令和SQL語句
2021-03-07
資料庫MySql
從語句繁簡和效能優化想到的......
2011-04-20
優化
高併發，大資料量系統的資料結構優化思路
2018-06-14
大資料資料結構優化
MySQL 52個SQL效能優化策略SQL語句彙總
2022-01-17
MySql優化
update語句的優化方式
2014-03-06
優化

MySQL大資料量快速插入方法和語句優化

相關文章