MySQL單表資料不要超過500萬行：是經驗數值，還是黃金鐵律？

樑桂釗發表於2019-06-20

原文網址 : https://juejin.im/post/5d0baf546fb9a07eef6a13a3

原文地址：樑桂釗的部落格

部落格地址：blog.720ui.com

歡迎關注公眾號：「服務端思維」。一群同頻者，一起成長，一起精進，打破認知的侷限性。

今天，探討一個有趣的話題：MySQL 單表資料達到多少時才需要考慮分庫分表？有人說 2000 萬行，也有人說 500 萬行。那麼，你覺得這個數值多少才合適呢？

曾經在中國網際網路技術圈廣為流傳著這麼一個說法：MySQL 單表資料量大於 2000 萬行，效能會明顯下降。事實上，這個傳聞據說最早起源於百度。具體情況大概是這樣的，當年的 DBA 測試 MySQL效能時發現，當單表的量在 2000 萬行量級的時候，SQL 操作的效能急劇下降，因此，結論由此而來。然後又據說百度的工程師流動到業界的其它公司，也帶去了這個資訊，所以，就在業界流傳開這麼一個說法。

再後來，阿里巴巴《Java 開發手冊》提出單錶行數超過 500 萬行或者單表容量超過 2GB，才推薦進行分庫分表。對此，有阿里的黃金鐵律支撐，所以，很多人設計大資料儲存時，多會以此為標準，進行分表操作。

那麼，你覺得這個數值多少才合適呢？為什麼不是 300 萬行，或者是 800 萬行，而是 500 萬行？也許你會說這個可能就是阿里的最佳實戰的數值吧？那麼，問題又來了，這個數值是如何評估出來的呢？稍等片刻，請你小小思考一會兒。

事實上，這個數值和實際記錄的條數無關，而與 MySQL 的配置以及機器的硬體有關。因為，MySQL 為了提高效能，會將表的索引裝載到記憶體中。InnoDB buffer size 足夠的情況下，其能完成全載入進記憶體，查詢不會有問題。但是，當單表資料庫到達某個量級的上限時，導致記憶體無法儲存其索引，使得之後的 SQL 查詢會產生磁碟 IO，從而導致效能下降。當然，這個還有具體的表結構的設計有關，最終導致的問題都是記憶體限制。這裡，增加硬體配置，可能會帶來立竿見影的效能提升哈。

那麼，我對於分庫分表的觀點是，需要結合實際需求，不宜過度設計，在專案一開始不採用分庫與分表設計，而是隨著業務的增長，在無法繼續優化的情況下，再考慮分庫與分表提高系統的效能。對此，阿里巴巴《Java 開發手冊》補充到：如果預計三年後的資料量根本達不到這個級別，請不要在建立表時就分庫分表。那麼，回到一開始的問題，你覺得這個數值多少才合適呢？我的建議是，根據自身的機器的情況綜合評估，如果心裡沒有標準，那麼暫時以 500 萬行作為一個統一的標準，相對而言算是一個比較折中的數值。

寫在末尾

【服務端思維】：我們一起聊聊服務端核心技術，探討一線網際網路的專案架構與實戰經驗。讓所有孤軍奮戰的研發人員都找到屬於自己的圈子，一起交流、探討。在這裡，我們可以認知升級，連線頂級的技術大牛，連線優秀的思維方式，連線解決問題的最短路徑，連線一切優秀的方法，打破認知的侷限。

更多精彩文章，盡在「服務端思維」！

資料是黃金還是垃圾？
2018-11-16
買黃金，還是買比特幣？
2020-12-02
比特幣
mysql for update是鎖表還是鎖行
2024-03-12
MySql
MySQL單表最大記錄數不能超過多少？
2019-06-23
MySql
什麼是黃金映象？
2019-08-08
PHP Mysql support: 是mysql 還是mysqlnd?
2019-07-01
PHPMySql
Mysql資料庫是如何通過索引定位資料
2020-12-12
MySql資料庫索引
智慧數字經營是什麼？是噱頭還是創新?
2021-09-15
黃東旭：“向量資料庫”還是“向量搜尋外掛 + SQL 資料庫”？
2024-02-15
資料庫SQL
Go語言引數傳遞是傳值？還是傳引用？
2022-01-16
Go
資料庫是平替還是改造？
2023-11-13
資料庫
管你MySQL還是Oracle，資料庫管理就完事了
2018-09-05
MySqlOracle資料庫
表單資料驗證
2018-11-15
checked屬性值是true還是checked
2019-01-07
皇御貴金屬：什麼是黃金T+D交易，如何做單？
2022-01-04
研究表明55歲數是當領導的黃金年齡
2019-05-27
mysql，sqlserver資料庫單表資料過大的處理方式
2019-04-01
MySqlServer資料庫
表單數值介於指定區間驗證
2019-03-29
轉行IT做碼農，現在還是IT行業的黃金時期嗎？
2020-09-23
行業
go語言引數傳遞到底是傳值還是傳引用
2020-11-08
Go
Java - 是值傳遞還是引用傳遞
2023-03-28
Java
世界黃金協會：全球已開採的黃金存量折算後超過20萬億美元
2024-09-26
部落格資料庫要連線Elasticsearch，使用MySQL還是Mong
2021-09-09
資料庫ElasticsearchMySql
javascript中怎麼判斷某變數是null,undefined,還是不存這個變數 ? 以及變數是array 還是 object 還是 null ?
2018-03-11
JavaScript變數NullUndefinedObject
“to B”的金礦還是BAT的？
2018-10-16
BAT
spring和springmvc是單例還是多例
2019-04-01
SpringMVC單例
解惑4：java是值傳遞還是引用傳遞
2020-08-05
Java
全球匯款下降幅度超過經濟衰退【附原資料表】
2020-06-30
【友盟+】超級使用者黃金法則：Top 10%的使用者價值是普通使用者的5倍
2018-03-15
13萬張表+數億行程式碼，遷移只需數小時，還是異構資料庫
2021-09-11
行程資料庫
英特爾大資料技術全球CTO戴金權：人工智慧和大資料是數字經濟的基石
2022-03-30
大資料人工智慧
mysqlpump淺談：mysqlpump併發的最小粒度是庫還是表，還是行？
2019-06-04
MySql
python 判斷變數是數字型還是字元型
2021-09-11
Python變數字元
MySQL超大表刪除資料過程
2024-03-26
MySql
Bernstein：加密貨幣市值超過2萬億美元與私人投資目的持有的黃金數量幾乎持平
2021-05-19
加密
部落格資料庫要連線Elasticsearch，使用MySQL還是MongoDB更合理
2021-02-28
資料庫ElasticsearchMySqlMongoDB
資料庫單表備份還原shell
2021-01-13
資料庫
“傻子”還是“瞎子”？那些遊戲裡的黃油漆是給誰看的？
2023-03-22
遊戲

MySQL單表資料不要超過500萬行：是經驗數值，還是黃金鐵律？

寫在末尾

相關文章