服務端指南資料儲存篇 | 選擇合適的資料儲存方案

樑桂釗發表於2017-04-26

在服務端會經常遇到資料儲存的選型問題，是選擇使用關係型資料庫 MySQL，還是選擇記憶體資料庫 Redis，還是選擇文件資料庫 MongoDB，還是選擇列族資料庫 HBase，還是選擇全文搜尋引擎 ElasticSearch 呢？本節主要介紹如何選擇合適的資料儲存方案。

原文地址：服務端指南資料儲存篇 | 選擇合適的資料儲存方案
部落格地址：blog.720ui.com/

關係型資料庫 MySQL

MySQL 是一個最流行的關係型資料庫，在網際網路產品中應用比較廣泛。一般情況下，MySQL 資料庫是選擇的第一方案，基本上有 80% ~ 90% 的場景都是基於 MySQL 資料庫的。因為，需要關係型資料庫進行管理，此外，業務存在許多事務性的操作，需要保證事務的強一致性。同時，可能還存在一些複雜的 SQL 的查詢。值得注意的是，前期儘量減少表的聯合查詢，便於後期資料量增大的情況下，做資料庫的分庫分表。

記憶體資料庫 Redis

隨著資料量的增長，MySQL 已經滿足不了大型網際網路類應用的需求。因此，Redis 基於記憶體儲存資料，可以極大的提高查詢效能，對產品在架構上很好的補充。例如，為了提高服務端介面的訪問速度，儘可能將讀頻率高的熱點資料存放在 Redis 中。這個是非常典型的以空間換時間的策略，使用更多的記憶體換取 CPU 資源，通過增加系統的記憶體消耗，來加快程式的執行速度。

在某些場景下，可以充分的利用 Redis 的特性，大大提高效率。這些場景包括快取，會話快取，時效性，訪問頻率，計數器，社交列表，記錄使用者判定資訊，交集、並集和差集，熱門列表與排行榜，最新動態等。

使用 Redis 做快取的時候，需要考慮資料不一致與髒讀、快取更新機制、快取可用性、快取服務降級、快取穿透、快取預熱等快取使用問題。

文件資料庫 MongoDB

MongoDB 是對傳統關係型資料庫的補充，它非常適合高伸縮性的場景，它是可擴充套件性的表結構。基於這點，可以將預期範圍內，表結構可能會不斷擴充套件的 MySQL 表結構，通過 MongoDB 來儲存，這就可以保證表結構的擴充套件性。

此外，日誌系統資料量特別大，如果用 MongoDB 資料庫儲存這些資料，利用分片叢集支援海量資料，同時使用聚集分析和 MapReduce 的能力，是個很好的選擇。

MongoDB 還適合儲存大尺寸的資料，GridFS 儲存方案就是基於 MongoDB 的分散式檔案儲存系統。

列族資料庫 HBase

HBase 適合海量資料的儲存與高效能實時查詢，它是執行於 HDFS 檔案系統之上，並且作為 MapReduce 分散式處理的目標資料庫，以支撐離線分析型應用。在資料倉儲、資料集市、商業智慧等領域發揮了越來越多的作用，在數以千計的企業中支撐著大量的大資料分析場景的應用。

全文搜尋引擎 ElasticSearch

在一般情況下，關係型資料庫的模糊查詢，都是通過 like 的方式進行查詢。其中，like "value%" 可以使用索引，但是對於 like "%value%" 這樣的方式，執行全表查詢，這在資料量小的表，不存在效能問題，但是對於海量資料，全表掃描是非常可怕的事情。ElasticSearch 作為一個建立在全文搜尋引擎 Apache Lucene 基礎上的實時的分散式搜尋和分析引擎，適用於處理實時搜尋應用場景。此外，使用 ElasticSearch 全文搜尋引擎，還可以支援多詞條查詢、匹配度與權重、自動聯想、拼寫糾錯等高階功能。因此，可以使用 ElasticSearch 作為關係型資料庫全文搜尋的功能補充，將要進行全文搜尋的資料快取一份到 ElasticSearch 上，達到處理複雜的業務與提高查詢速度的目的。

ElasticSearch 不僅僅適用於搜尋場景，還非常適合日誌處理與分析的場景。著名的 ELK 日誌處理方案，由 ElasticSearch、Logstash 和 Kibana 三個元件組成，包括了日誌收集、聚合、多維度查詢、視覺化顯示等。

（完）

更多精彩文章，盡在「服務端思維」微信公眾號！

服務端指南資料儲存篇 | MySQL（02）儲存引擎的 InnoDB 與 MyISAM 之爭
2019-03-01
服務端MySql儲存引擎
服務端指南資料儲存篇 | 聊聊 MongoDB 使用場景
2019-03-01
服務端MongoDB
服務端指南資料儲存篇 | 聊聊 Redis 使用場景
2019-03-03
服務端Redis
資料儲存--檔案儲存
2024-05-26
iOS開發資料儲存篇—iOS中的幾種資料儲存方式
2018-11-29
iOS
企業雲盤，資料儲存的必要選擇
2021-01-09
瀏覽器端儲存資料的終極指南
2022-02-04
瀏覽器
小米大資料儲存服務的資料治理實踐
2023-02-21
大資料
常見的瀏覽器端資料儲存方案
2019-03-21
瀏覽器
資料儲存(1)：從資料儲存看人類文明-資料儲存器發展歷程
2020-07-27
資料成本：雲端儲存成本高嗎如何節省資料儲存成本
2022-05-12
儲存刪除資料後恢復方法-適用netAPP儲存
2018-09-14
APP
客戶端資料儲存概述
2019-02-16
客戶端
選擇雲端儲存服務需要注意哪些事項？
2021-07-22
TiDB資料儲存
2020-10-13
TiDB
資料儲存：CoreData
2019-03-05
iOS 資料儲存
2022-07-18
iOS
Android中的資料儲存之檔案儲存
2020-03-11
Android
聚焦資料時代新儲存需求，浪潮儲存的新儲存之道
2020-12-03
Flutter持久化儲存之資料庫儲存
2019-03-08
Flutter持久化資料庫
資料儲存(歸檔解檔，沙河儲存)
2018-03-27
【儲存資料恢復】NetApp儲存誤刪資料夾的資料恢復案例
2022-08-15
資料恢復APP
杉巖資料企業雲端儲存解決方案
2020-03-20
資料的儲存區域
2019-05-11
有效儲存資料的方法
2022-09-29
星環科技多模型資料統一儲存的大資料分散式儲存平臺方案分享
2022-09-16
模型大資料分散式
【儲存資料恢復】NetApp儲存誤刪除的資料恢復案例
2022-09-02
資料恢復APP
#第9篇分享：python資料儲存-MySQL資料庫
2020-10-14
PythonMySql資料庫
儲存資料之SharedPreference
2019-02-28
SettingsProvider資料儲存位置
2018-06-11
IDE
Flutter 資料儲存 SharedPreferences
2020-04-09
Flutter
SRAM資料儲存原理
2020-06-05
用SharedPreference儲存資料
2021-09-09
k8s之資料儲存-配置儲存
2021-08-19
K8S
為高效能FPGA平臺選擇合適的儲存器
2020-09-27
FPGA
杉巖資料安全儲存解決方案
2020-01-20
杉巖海量資料儲存解決方案
2019-12-30
資料儲存-領存高速海量資料記錄儲存模組產品介紹
2021-04-08
本地儲存VS雲端儲存：區別不只是資料存放位置
2019-02-20