MySQL中的批量初始化資料的對比測試(r12筆記第71天)

jeanron100發表於2017-05-21

MySql筆記

一直以來對於MySQL的儲存過程效能還是頗有微詞的，說實話夠慢的。有時候想做一些對比測試，儲存過程初始化幾萬條資料都得好一會兒，這功夫Oracle類似的測試早都做完了，今天就趕個晚班車，把這個沒做完的任務完成了。

我大體測試了一下，以100萬資料為基準，初始化效能的提升會從近8分鐘提升到10多秒鐘。

我自己嘗試了以下4種方案。

1.儲存過程批量匯入（近8分鐘）

2.儲存過程批量匯入記憶體表，記憶體表匯入目標表（近5分鐘）

3.使用shell指令碼生成資料，使用load data的方式匯入資料（近20秒）

4.使用shell指令碼生成資料，使用load data的方式匯入記憶體表，記憶體表資料匯入目標表（近18秒）

方案1：儲存過程匯入

我們測試使用的表為users，InnoDB儲存引擎，計劃初始化資料為100萬。

create table users(
userid int(11) unsigned not null,
user_name varchar(64) default null,
primary key(userid)
)engine=innodb default charset=UTF8;使用如下的方式來初始化資料，我們就使用儲存過程的方式。

delimiter $$
drop procedure if exists proc_auto_insertdata$$
create procedure proc_auto_insertdata()
begin
    declare
    init_data integer default 1;
    while init_data<=100000 do
    insert into users values(init_data,concat('user'    ,init_data));
    set init_data=init_data+1;
    end while;
end$$
delimiter ;
call proc_auto_insertdata();因為我對這個過程還是信心不足，所以就抓取了十分之一的資料10萬條資料，測試的結果是執行了47秒鐘左右，按照這個資料量大概需要8分鐘左右。
> source create_proc.sql
Query OK, 0 rows affected, 1 warning (0.04 sec)
Query OK, 0 rows affected (0.02 sec)
Query OK, 1 row affected (47.41 sec)    所以這個過程雖然是一步到位，但是效能還是差強人意，我看有的同學在不同的配置下效能差別很大，有的同學達到了近50分鐘。這一點上以自己的測試環境為準，然後能夠得到一個梯度的資料就可以了。

我們來看看第二個方案。

方案2：使用記憶體表

第二個方案，我們嘗試使用記憶體表來優化，這樣一來我們就需要建立一個記憶體表，比如名叫users_memory。

create table users_memory(
userid int(11) unsigned not null,
user_name varchar(64) default null,
primary key(userid)
)engine=memory default charset=UTF8;然後使用如下的儲存過程來匯入資料，其實邏輯和第一個儲存過程幾乎一樣，就表名不一樣而已，這個裡面資料是入到記憶體表中。

delimiter $$
drop procedure if exists proc_auto_insertdata$$
create procedure proc_auto_insertdata()
begin
    declare
    init_data integer default 1;
    while init_data<=1000000 do
    insert into users_memory values(init_data,concat('user'    ,init_data));
    set init_data=init_data+1;
    end while;
end$$
delimiter ;
call proc_auto_insertdata ;這個過程可能會丟擲table is full相關的資訊，我們可以適當調整引數tmpdir（修改需要重啟）,max_heap_table_size（線上修改），然後重試基本就可以了。
> source create_proc_mem.sql
Query OK, 0 rows affected (0.00 sec)
Query OK, 0 rows affected (0.00 sec)
Query OK, 1 row affected (4 min 40.23 sec)這個過程用時近5分鐘，剩下的記憶體表資料匯入InnoDB表很快了，幾秒鐘即可搞定。
> insert into users select *from users_memory;
整個過程下來不到5分鐘，和第一種方案相比快了很多。

方案3：使用程式/指令碼生成資料，批量匯入

第三種方案只是拋磚引玉，如果你對php熟悉，可以完全用php來寫，對哪種語言指令碼熟悉，只要實現需求即可。比如我使用shell，也沒有使用什麼特別的技巧。
shell指令碼內容如下：

for i in {1..1000000}
do
echo $i,user_$i
done > a.lst指令碼寫得很簡單，生成資料的過程大概耗時8秒鐘，檔案有18M左右。

# time sh a.sh
real    0m8.366s
user    0m6.312s
sys     0m2.039s然後使用load data來匯入資料，整個過程花費時間大概在8秒鐘左右，所以整個過程的時間在19秒以內。

> load data infile '/U01/testdata/a.lst' into table users fields terminated by ',' ;
Query OK, 1000000 rows affected (8.05 sec)
Records: 1000000 Deleted: 0 Skipped: 0 Warnings: 0

方案4：記憶體表,外部檔案匯入混合

第四種方案是臨時想的，也是結合了這幾種方案的一些特點，當然不能說它就是最好的。

首先使用指令碼生成資料，還是和方案3一樣，估算為9秒鐘，匯入資料到記憶體表users_memory裡面。

> load data infile '/U01/testdata/a.lst' into table users_memory fields terminated by ',' ;
Query OK, 1000000 rows affected (1.91 sec)
Records: 1000000 Deleted: 0 Skipped: 0 Warnings: 0然後把記憶體表的資料匯入目標表users

> insert into users select *from users_memory;
Query OK, 1000000 rows affected (7.48 sec)
Records: 1000000 Duplicates: 0 Warnings: 0整個過程耗時在18秒，和第三種方案很相似，看起來略微複雜了或者囉嗦了一些。

以上幾種方案只是個人的一些簡單測試總結，如果你有好的方案，希望多提意見，多多溝通。

掃碼或者長按如下的圖片都可以關注我的公眾號，繼續努力中。。。

MySQL中的批量初始化資料的對比測試(r12筆記第71天)

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/23718752/viewspace-2139656/，如需轉載，請註明出處，否則將追究法律責任。

mysqlpump的效能測試(r12筆記第89天)
2017-06-08
MySql筆記
MySQL中的derived table(r12筆記第47天)
2017-04-27
MySql筆記
MySQL自增列主從不一致的測試(r12筆記第37天)
2017-04-17
MySql筆記
水煮oracle29----oracle中對資料的批量操作測試
2013-09-27
Oracle
批量更新資料方法比較測試
2011-01-24
分分鐘搭建MySQL Group Replication測試環境（二）(r12筆記第41天)
2017-04-21
MySql筆記
Oracle閃回原理測試（三）(r12筆記第16天)
2017-03-27
Oracle筆記
sandbox和MHA快速測試(r12筆記第32天)
2017-04-12
筆記
MySQL中的binlog和redo淺析(r12筆記第5天)
2017-03-27
MySql筆記
SOA 環境中的測試驅動的開發，第 1 部分: 測試資料對映
2009-06-03
資料庫執行效率的對比測試
2014-11-14
資料庫
使用pt工具檢測MySQL主從延遲（r12筆記第7天）
2017-03-18
MySql筆記
資料架構難點-資料分佈（r12筆記第43天）
2017-04-23
架構筆記
MySQL自增列的重複值問題(r12筆記第25天)
2017-04-05
MySql筆記
MySQL無法建立表的問題分析(r12筆記第73天)
2017-05-23
MySql筆記
MySQL原始碼安裝總結(r12筆記第12天)
2017-04-19
MySql原始碼筆記
歸零的心態(r12筆記第82天)
2017-06-01
筆記
MySQL引數對比淺析(r11筆記第97天)
2017-03-08
MySql筆記
MySQL 資料對比
2021-09-02
MySql
MySQL數值型別在binlog中需要注意的細節(r12筆記第69天)
2017-05-19
MySql型別筆記
相同update語句在MySQL，Oracle的不同表現（r12筆記第30天）
2017-04-10
MySqlOracle筆記
MySQL中一個文件疏漏的分析測試(r13筆記第3天)
2017-06-23
MySql筆記
心理學中的效應簡單解讀(r12筆記第24天)
2017-04-04
筆記
oracle Mysql PostgreSQL 資料庫的對比
2024-07-17
OracleMySql資料庫
MySQL傳輸表空間小結(r12筆記第2天)
2017-03-13
MySql筆記
MySQL service啟動指令碼淺析（r12筆記第59天）
2017-05-09
MySql指令碼筆記
我爸爸眼中的我(r12筆記第22天)
2017-04-02
筆記
一個IT人和ppt的故事(r12筆記第39天)
2017-04-19
筆記
我的女兒二三事（七）（r12筆記第58天）
2017-05-08
筆記
玩足彩的一點感受(r12筆記第80天)
2017-05-30
筆記
jmeter對mysql db2 oracle資料庫測試的配置
2007-06-12
JMeterMySqlDB2Oracle資料庫
大資料測試學習筆記之測試工具集
2019-05-15
大資料筆記
分享一個批量產生隨機測試資料的MySQL儲存過程
2019-06-24
隨機MySql儲存過程
MySQL和Oracle行值表示式對比(r11筆記第74天)
2017-02-13
MySqlOracle筆記
mysqldump的一點使用總結(r12筆記第81天)
2017-05-31
MySql筆記
駕考的一點總結(r12筆記第93天)
2017-06-13
筆記
使用sysbench壓力測試MySQL（一）(r11筆記第3天)
2018-04-12
MySql筆記
mysql初始化表資料及插入多條資料學習筆記
2018-07-25
MySql筆記

MySQL中的批量初始化資料的對比測試(r12筆記第71天)

相關文章