3.6 總結(服務效能剖析總結)《伺服器效能剖析》

weixin_34019929發表於2018-11-15

基本知識點:

(1)定義效能最有效的方法是響應時間

(2)效能優化工作需要基於高質量、全方位及完整的響應時間測量

(3)測量的最佳開始點應用程式,而不是資料庫。即使問題在底層DB,也能發現

(4)如無法完整測量/有錯誤結果。想辦法繞過限制,get好結果

(5)完整的測量會產生大量需要分析的資料,所以需要用到剖析器。這是最佳的工具,可以幫助將重要的問題冒泡到前面,這樣就可以決定從哪裡開始分析會比較好。

(6)剖析報告是一種彙總資訊,掩蓋和丟棄了太多細節,完全依賴不明智。

(7)消耗時間操作:工作或者等待剖析器(大多數)只測工作消耗的時間等待分析是很有用的補充,尤其是當CPU 利用率很低但工作卻一直無法完成的時候。

(8)提升成本超過收益的時候,應當停止優化

總體來說,我們認為解決效能問題的方法:

(1)澄清問題:選擇合適的技術來解答。提升伺服器的總體效能,將所有查詢記錄到日誌中

(2)pt-query-digest 生成剖析報告。消耗時間最多、或者高度變化,有奇怪的響應時間直方圖的查詢。

(3)找到這些“壞”查詢時,要鑽取pt-query-digest 報告中包含的該查詢的詳細資訊,或者使用SHOW PROFILE 及其他諸如EXPLAIN 這樣的工具。

找不到查詢效能低下的原因,也可能伺服器的效能問題。這時,較高精度測量和繪製伺服器狀態計數器的細節資訊。如分析重現了問題,同樣的資料制定觸發條件,收集更多診斷資料。

相關文章