MySQL 效能優化之硬體瓶頸分析

神諭丶發表於2015-05-14

在過往與很多人的交流過程中發現，在談到基於硬體來進行資料庫效能瓶頸分析的時候，常被大家誤解為簡單的使用更為強勁的主機或者儲存來替換現有的裝置。

個人覺得這其中可能存在一個非常大的誤區。我們在談論基於硬體進行優化的時候，不能僅僅將資料庫使用的硬體劃分為主機和儲存兩部分，而是需要進一步對硬體進行更細的分解，至少也應該分解到如下範疇：

主機
- CPU：僅僅只能決定運算速度，及時是運算速度都還取決於與記憶體之間的匯流排頻寬以及記憶體本身的速度
- 記憶體：大小決定了所能快取的資料量，主要決定了熱點資料的訪問速度
- 磁碟：
  - 大小：決定了你最終能存放多少資料量
  - 轉速：決定了你每一次IO請求的延時時間，也就是決定了我們常說的IOPS和MBPS
  - 數目：磁碟數目決定了
  - 型別
    - 機械：SAS or SATA or FC ？
    - SSD：磁碟 or PCI卡？
- Raid卡：
  - 快取：快取大小對資料寫入速度有較大影響，使用策略也會直接影響IO效率
  - 電池：電池充放電策略會影響到瞬時IO的波動
- 其他：如匯流排頻寬等，決定了CPU與記憶體間資料傳輸效率，這一點很多時候關注較少，但也可能會出現瓶頸
儲存
- 記憶體：儲存裝置同樣也有記憶體，用來儲存前端主機訪問的熱點資料。儲存的記憶體大小同樣決定了熱點資料的訪問速度
- 磁碟：和主機磁碟類似
- 線路/環路頻寬：環路頻寬必須能夠匹配磁碟頻寬，至少不能少於磁碟所能輸出的能力，否則就想被堵在高速收費站等待通行的車輛一樣
網路
- 延時：不同的網路裝置其延時會有差異，對於 OLTP 裝置來說，延時自然是越小越好
- 吞吐量：對於資料庫叢集來說，各個節點之間的網路吞吐量可能直接決定叢集的處理能力
- iops：對於 OLTP 系統，資料傳輸更多是以小IO多併發方式，有時候光有大頻寬並不一定能滿足需求

硬體角度所能提供的處理能力，一定是上面所列的多個方面（這裡僅僅只是主要部分，可能還有其他）共同決定的整體能力，任何一個方面出現瓶頸，都能導致整體效能上不去，也就是我們常說的木桶原理。

在以往的經驗中，最容易出現效能瓶頸的地方主要會出現在以下幾個方面：

IO資源方面瓶頸
出現 IO 資源方面瓶頸的時候，主要表現在伺服器 iowait 很高，usr 佔比較少，系統響應較慢，資料庫中經常會存在大量執行狀態的 session。
遇到 IO 資源方面的瓶頸，我們可以使用的硬體層面優化方案主要就是：
- 增加記憶體加大可快取的資料量：這個方案能否達到效果取決於系統熱點資料的總量，畢竟記憶體的成本也是比較高的，而且單臺裝置所能管理的記憶體量也是有限的
- 改善底層儲存裝置的 IO 能力：如本文前面所述，底層儲存能力的改善同時取決於多個方面，既有單個磁碟本身的能力問題，也包括磁碟數目方面的策略，同時還受到儲存自身以及儲存和主機之間的頻寬限制。所以在優化底層儲存能力的同時需要同時考慮到這3方面的因素，做好總體分析和區域性的平衡
CPU資源方面瓶頸
當 CPU 方面資源遇到瓶頸的時候，主要表現在伺服器CPU利用率中 usr 所佔比例很高，iowait卻很小。這類問題大多出現在資料量並不是太大，同時又有足夠記憶體來對資料進行快取的應用場景。同時也是目前大多數中小網站所面臨的資料庫效能瓶頸。
當遇到 CPU 方面的資源瓶頸的時候，可能由兩個方面造成：
- 過多依賴資料庫進行邏輯運算：對於這種狀況，最好的優化方式是將運算儘可能從資料庫端遷移到應用端，降低資料庫主機的計算量。畢竟對有狀態的系統裝置（資料庫）進行擴容的成本遠高於無狀態類系統裝置（應用）。當然如果非要從資料庫端的硬體來解決問題，那就只有通過增加裝置CPU數目（如果支援），或者是使用CPU能力更為高階的主機來替換老主機
- 資料庫邏輯IO太大：對於這類狀況，從硬體角度來說能做的就只有提升CPU處理能力。要麼增加 CPU 數目（如果支援），要麼換CPU更強勁的主機。但是在這之前，還是建議先嚐試從應用角度優化看看是否能夠儘量降低非必要請求或者是減少每次請求的資料量。同時從資料庫角度針對 Schema結構以及索引進行相應的優化調整，儘可能讓完成一次請求所需要檢索的資料量更小，從而達到降低邏輯IO的目的
網路資源方面的瓶頸
一般來說應用與資料庫之間的網路互動所需的資源並不是非常大，所以這個環境遇到瓶頸的可能並不是非常大。但是在分散式的叢集環境中，各個資料庫節點之間的網路環境經常會稱為系統的瓶頸。
比較常見的場景如 MySQL Cluster 或者是 Oracle RAC 環境中，節點之間的資料交換網路環境的優劣可能直接影響到系統的整體處理能力，因為在節點間會存在大量的資料交換，都是依賴網路傳輸來完成。
在這樣的場景中，廉價一點的解決方案是通過 萬兆交換機 來替換現在常用的 千兆交換機 來提升網路處理能力降低網路延時。不過這個方案主要提升的是吞吐量方面，對於延時方面的提升可能並不一定能滿足某些要求非常高的場景。這時候就該考慮使用更為昂貴但也更高效的方案：用 Infiniband 替換普通交換機來極大的降低網路方面所帶來的資料交換延時。

以上僅僅只針對主要型別的硬體資源瓶頸做了一些分析和相應可能的處理方式，歡迎大家一起探討，也可以包括目前比較“熱”的SSD。後面我可能還會再寫一篇關於 SSD 的文章，國內接觸 SSD 並將之正式用於核心產品環境的，可能比我更早人還是比較少的。

作者：Sky.Jian | 可以任意轉載, 但轉載時務必以超連結形式標明文章原始出處和作者資訊及版權宣告
連結：http://isky000.com/database/mysql-performance-tuning-hardware

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/29773961/viewspace-1654800/，如需轉載，請註明出處，否則將追究法律責任。

效能測試瓶頸之CPU問題分析與調優
2024-08-05
效能測試瓶頸調優
2021-09-01
Oracle效能優化方法論的發展之四：基於資源瓶頸分析的優化方法論
2018-10-12
Oracle優化
利用PerfDog分析遊戲效能瓶頸
2020-04-01
遊戲
Chrome執行時效能瓶頸分析
2019-05-08
Chrome
2020.10.8 效能課堂筆記-記憶體瓶頸分析
2020-10-08
筆記記憶體
LightDB資料庫效能瓶頸分析（一）
2022-06-29
資料庫
如何解決SQL Server資料庫的軟硬體效能瓶頸OC
2022-03-21
SQLServer資料庫
軟體測試：瓶頸分析方法
2019-08-26
效能測試-服務端瓶頸分析思路
2019-07-30
服務端
2020.10.6 效能課堂筆記-cpu 瓶頸分析
2020-10-06
筆記
突破效能瓶頸，實現流程自動化
2022-08-29
記錄node記憶體瓶頸分析
2018-03-23
記憶體
伺服器IO瓶頸對MySQL效能的影響
2021-09-09
伺服器MySql
SQL Server 資料庫最佳化效能瓶頸
2024-08-24
SQLServer資料庫
效能調優學習之硬體調優
2024-05-19
各種儲存效能瓶頸場景的分析與最佳化手段
2021-09-13
在Linux中，如何進行系統效能瓶頸分析？
2024-06-02
Linux
JVM 效能調優實戰之：一次系統效能瓶頸的尋找過程
2018-07-02
JVM
效能之殤：從馮·諾依曼瓶頸談起
2018-12-18
效能分析（6）- 如何迅速分析出系統 CPU 的瓶頸在哪裡
2020-08-12
如何正確定義效能瓶頸
2024-03-09
用 pprof 找出程式碼效能瓶頸
2020-06-09
“堆硬體”逐漸接近效能瓶頸時，遊戲畫面接下來要怎麼發展？
2020-07-15
遊戲
六、Android效能優化之UI卡頓分析之渲染效能優化
2018-04-26
Android優化UI
Redis效能瓶頸揭秘：如何最佳化大key問題？
2023-04-17
Redis
軟體測試學習資源—瓶頸分析方法
2019-08-16
效能課堂-TPS 瓶頸精準定位
2020-07-06
如何使用 Wireshark 分析 TCP 吞吐瓶頸
2022-09-09
TCP
MySQL效能優化之索引設計
2022-03-08
MySql優化索引
Android 效能優化之記憶體優化
2018-05-21
Android優化記憶體
資料庫叢集伺服器系統效能瓶頸分析(zt)
2019-04-18
資料庫伺服器
漫談前端效能突破 React 應用瓶頸
2018-08-14
前端React
實用技巧：快速定位Zuul的效能瓶頸
2021-09-09
Zuul
I/O已經不再是效能瓶頸
2023-02-07
mysql效能優化
2020-08-01
MySql優化
MySQL——效能優化
2020-11-18
MySql優化
【MySQL】三、效能優化之覆蓋索引
2018-10-11
MySql優化索引
《MySQL 效能優化》之 InnoDB 儲存引擎
2022-03-13
MySql優化儲存引擎

MySQL 效能優化之硬體瓶頸分析

相關文章