服務端指南資料儲存篇 | MySQL（09）分庫與分錶帶來的分散式困境與應對之策

樑桂釗發表於2017-05-08

原文網址 : https://flycode.co/archives/46045

隨著使用者數的不斷增加，以及資料量的不斷增加，通過分庫與分表的方式提高查詢效能的同時，帶來了一系列分散式困境。

原文地址：服務端指南資料儲存篇 | MySQL（09）分庫與分錶帶來的分散式困境與應對之策
部落格地址：blog.720ui.com/

資料遷移與擴容問題

前面介紹到水平分表策略歸納總結為隨機分表和連續分表兩種情況。連續分表有可能存在資料熱點的問題，有些表可能會被頻繁地查詢從而造成較大壓力，熱資料的表就成為了整個庫的瓶頸，而有些表可能存的是歷史資料，很少需要被查詢到。連續分表的另外一個好處在於比較容易，不需要考慮遷移舊的資料，只需要新增分表就可以自動擴容。隨機分表的資料相對比較均勻，不容易出現熱點和併發訪問的瓶頸。但是，分表擴充套件需要遷移舊的資料。
針對於水平分表的設計至關重要，需要評估中短期內業務的增長速度，對當前的資料量進行容量規劃，綜合成本因素，推算出大概需要多少分片。對於資料遷移的問題，一般做法是通過程式先讀出資料，然後按照指定的分表策略再將資料寫入到各個分表中。

表關聯問題

在單庫單表的情況下，聯合查詢是非常容易的。但是，隨著分庫與分表的演變，聯合查詢就遇到跨庫關聯和跨表關係問題。在設計之初就應該儘量避免聯合查詢，可以通過程式中進行拼裝，或者通過反正規化化設計進行規避。

分頁與排序問題

一般情況下，列表分頁時需要按照指定欄位進行排序。在單庫單表的情況下，分頁和排序也是非常容易的。但是，隨著分庫與分表的演變，也會遇到跨庫排序和跨表排序問題。為了最終結果的準確性，需要在不同的分表中將資料進行排序並返回，並將不同分表返回的結果集進行彙總和再次排序，最後再返回給使用者。

分散式事務問題

隨著分庫與分表的演變，一定會遇到分散式事務問題，那麼如何保證資料的一致性就成為一個必須面對的問題。目前，分散式事務並沒有很好的解決方案，難以滿足資料強一致性，一般情況下，使儲存資料儘可能達到使用者一致，保證系統經過一段較短的時間的自我恢復和修正，資料最終達到一致。

分散式全域性唯一ID

在單庫單表的情況下，直接使用資料庫自增特性來生成主鍵ID，這樣確實比較簡單。在分庫分表的環境中，資料分佈在不同的分表上，不能再借助資料庫自增長特性。需要使用全域性唯一 ID，例如 UUID、GUID等。關於如何選擇合適的全域性唯一 ID，我會在後面的章節中進行介紹。

總結

分庫與分表主要用於應對當前網際網路常見的兩個場景：海量資料和高併發。然而，分庫與分表是一把雙刃劍，雖然很好的應對海量資料和高併發對資料庫的衝擊和壓力，但是卻提高的系統的複雜度和維護成本。

因此，我的建議：需要結合實際需求，不宜過度設計，在專案一開始不採用分庫與分表設計，而是隨著業務的增長，在無法繼續優化的情況下，再考慮分庫與分表提高系統的效能。

（完）

更多精彩文章，盡在「服務端思維」微信公眾號！

服務端指南資料儲存篇 | MySQL（09）分庫與分錶帶來的分散式困境與應對之策

服務端指南資料儲存篇 | MySQL（02）儲存引擎的 InnoDB 與 MyISAM 之爭
2019-03-01
服務端MySql儲存引擎
《資料儲存》之《分庫，分表》
2021-07-20
分散式儲存中的資料分佈策略
2018-11-22
分散式
服務端指南資料儲存篇 | 聊聊 MongoDB 使用場景
2019-03-01
服務端MongoDB
服務端指南資料儲存篇 | 聊聊 Redis 使用場景
2019-03-03
服務端Redis
分散式文件儲存資料庫之MongoDB備份與恢復
2020-11-16
分散式資料庫MongoDB
強！分庫分表與分散式資料庫技術選項分析
2022-12-08
分散式資料庫
大資料分散式儲存的部署模式：分離式or超融合
2018-11-07
大資料分散式模式
效能優化之資料庫篇5-分庫分表與資料遷移
2021-07-29
優化資料庫
重新學習Mysql資料庫3：Mysql儲存引擎與資料儲存原理
2019-11-16
MySql資料庫儲存引擎
分散式系統技術：儲存之資料庫
2020-06-05
分散式資料庫
分散式文件儲存資料庫之MongoDB副本集
2020-11-10
分散式資料庫MongoDB
分散式文件儲存資料庫之MongoDB索引管理
2020-11-09
分散式資料庫MongoDB索引
報表資料分庫儲存
2019-12-10
從Google Spanner漫談分散式儲存與資料庫技術XA
2022-03-21
Go分散式資料庫
分散式文件儲存資料庫之MongoDB訪問控制
2020-11-14
分散式資料庫MongoDB
分散式文件儲存資料庫之MongoDB分片叢集
2020-11-12
分散式資料庫MongoDB
大資料儲存解決方案中的分離式與超融合部署
2018-09-03
大資料
淺談分散式儲存系統的資料分佈演算法
2018-07-01
分散式演算法
分散式服務資料一致性-mysql篇
2022-02-10
分散式MySql
分散式文件儲存資料庫之MongoDB基礎入門
2020-11-08
分散式資料庫MongoDB
Hadoop HDFS 3.3.1分散式儲存搭建
2022-01-17
Hadoop分散式
實現報表資料分庫儲存
2019-12-18
分散式事務之資料庫事務與JDBC事務實現（一）
2018-08-10
分散式資料庫JDBC
#第9篇分享：python資料儲存-MySQL資料庫
2020-10-14
PythonMySql資料庫
分散式資料庫中介軟體 MyCat | 分庫分表實踐
2020-08-20
分散式資料庫
MySQL資料庫與Nacos搭建監控服務
2023-04-07
MySql資料庫
Spring Boot 揭祕與實戰（二）資料儲存篇 – MySQL
2019-03-04
Spring BootMySql
關聯式資料庫大泥球帶來的管理問題和對策 - pathelland
2020-11-22
資料庫
資料庫分庫，原來 SQL 和儲存過程寫的報表咋辦？
2020-06-19
資料庫SQL儲存過程
基於 SmartX 分散式儲存的 RDMA 與 TCP/IP 技術與效能對比
2023-02-08
分散式TCP
【大資料】BigTable分散式資料儲存系統分散式資料庫 | 複習筆記
2020-12-12
大資料分散式資料庫筆記
mySql 儲存過程與函式
2024-05-24
MySql儲存過程函式
10分鐘搞懂：億級使用者的分散式資料儲存解決方案！
2019-06-28
分散式
雲端計算導論 # 3 雲端儲存技術：概念、結構模型、關鍵技術、分散式資料儲存、常見儲存結構、應用與問題
2020-12-21
模型分散式
MySQL索引、事務與儲存引擎
2024-06-23
MySql索引儲存引擎
MySQL資料庫中的分組函式ROLLUP
2024-05-30
MySql資料庫函式
VMware 與 SmartX 分散式儲存快取機制淺析與效能對比
2022-09-16
分散式快取
分散式資料庫的需求與場景
2023-11-22
分散式資料庫

服務端指南 資料儲存篇 | MySQL（09） 分庫與分錶帶來的分散式困境與應對之策