MySQL大量資料插入各種方法效能分析與比較

發表於2015-04-02

不管是日常業務資料處理中,還是資料庫的匯入匯出,都可能遇到需要處理大量資料的插入。插入的方式和資料庫引擎都會對插入速度造成影響,這篇文章旨在從理論和實踐上對各種方法進行分析和比較,方便以後應用中插入方法的選擇。

插入分析

MySQL中插入一個記錄需要的時間由下列因素組成,其中的數字表示大約比例:

  • 連線:(3)
  • 傳送查詢給伺服器:(2)
  • 分析查詢:(2)
  • 插入記錄:(1x記錄大小)
  • 插入索引:(1x索引)
  • 關閉:(1)

如果我們每插入一條都執行一個SQL語句,那麼我們需要執行除了連線和關閉之外的所有步驟N次,這樣是非常耗時的,優化的方式有一下幾種:

  1. 在每個insert語句中寫入多行,批量插入
  2. 將所有查詢語句寫入事務中
  3. 利用Load Data匯入資料

每種方式執行的效能如下。

Innodb引擎

InnoDB 給 MySQL 提供了具有事務(commit)、回滾(rollback)和崩潰修復能力(crash recovery capabilities)的事務安全(transaction-safe (ACID compliant))型表。InnoDB 提供了行鎖(locking on row level)以及外來鍵約束(FOREIGN KEY constraints)。

InnoDB 的設計目標是處理大容量資料庫系統,它的 CPU 利用率是其它基於磁碟的關聯式資料庫引擎所不能比的。在技術上,InnoDB 是一套放在 MySQL 後臺的完整資料庫系統,InnoDB 在主記憶體中建立其專用的緩衝池用於高速緩衝資料和索引。

測試環境

Macbook Air 12mid apache2.2.26 php5.5.10 mysql5.6.16

總數100W條資料

插入完後資料庫大小38.6MB(無索引),46.8(有索引)

  • 無索引單條插入 總耗時:229s 峰值記憶體:246KB
  • 有索引單條插入 總耗時:242s 峰值記憶體:246KB
  • 無索引批量插入 總耗時:10s 峰值記憶體:8643KB
  • 有索引批量插入 總耗時:16s 峰值記憶體:8643KB
  • 無索引事務插入 總耗時:78s 峰值記憶體:246KB
  • 有索引事務插入 總耗時:82s 峰值記憶體:246KB
  • 無索引Load Data插入 總耗時:12s 峰值記憶體:246KB
  • 有索引Load Data插入 總耗時:11s 峰值記憶體:246KB

MyIASM引擎

MyISAM 是MySQL預設存貯引擎。設計簡單,支援全文搜尋。

測試環境

Macbook Air 12mid apache2.2.26 php5.5.10 mysql5.6.16

總數100W條資料

插入完後資料庫大小19.1MB(無索引),38.6(有索引)

  • 無索引單條插入 總耗時:82s 峰值記憶體:246KB
  • 有索引單條插入 總耗時:86s 峰值記憶體:246KB
  • 無索引批量插入 總耗時:3s 峰值記憶體:8643KB
  • 有索引批量插入 總耗時:7s 峰值記憶體:8643KB
  • 無索引Load Data插入 總耗時:6s 峰值記憶體:246KB
  • 有索引Load Data插入 總耗時:8s 峰值記憶體:246KB

總結

我測試的資料量不是很大,不過可以大概瞭解這幾種插入方式對於速度的影響,最快的必然是Load Data方式。這種方式相對比較麻煩,因為涉及到了寫檔案,但是可以兼顧記憶體和速度。

測試程式碼

相關文章