一次快取效能問題排查
概述
以下分享的都跳過了很多坑,包括redis、tomcat環境配置、機器硬體配置等等問題(與線上保持一致,或者硬體效能減配係數,例如線上:8C16G,壓測:4C8G,係數簡單相差2倍),直接把挖掘瓶頸的主要思路搬出 檯面。
壓測資料分析
全域性圖預覽
透過對某直播觀看頁面進行高併發壓測,在APM監控中發現一個有趣的地方:
上圖中兩個紅框中的資料(接近10s),相隔大概30分鐘就發生,16:20左右,系統撐不住服務出現異常不可用,懷著好奇的心態,追查方法呼叫的棧,如下圖所示:
該方法耗時多久呢?首先搞清楚Call Tree裡面的一些概念:
可見這個sql查詢方法耗時14秒多,為什麼呢?APM裡面已經顯示了sql語句,在mysql中執行查詢發現執行時間很快,那麼問題出在哪裡呢?只能繼續深挖!
透過對比同樣的url,請求響應毫秒級的情況下,發現資料如下圖所示:
從redis獲取到資料後,並沒有再執行sql查詢了,透過這個分析,我們決定追蹤程式碼還原真相(不懂程式碼的測試不是好開發):
可以看到快取失效之後,直接查詢資料庫了
解決方案
SQL最佳化:優先順序低
從資料分析來看,sql最佳化的用處不大,並不是返回了大量資料缺少索引,此次可以跳過。
快取併發:優先順序高
出現場景:當網站併發訪問高,一個快取如果失效,可能出現多個程式同時查詢DB,同時設定快取的情況,如果併發確實很大,這也可能造成DB壓力過大,還有快取頻繁更新的問題。
處理方法:對快取查詢加鎖,如果KEY不存在,就加鎖,然後查DB入快取,然後解鎖;其他程式如果發現有鎖就等待,然後等解鎖後返回資料或者進入DB查詢。
經驗總結
1、善用監控工具,例如APM,進行鏈路監控、伺服器效能、方法呼叫順序觀察
2、追蹤方法棧和相關日誌
3、深入排查程式碼挖本質
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69942496/viewspace-2654915/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 一次容器MySQL的效能問題排查MySql
- 記錄一次問題排查
- 記一次oom問題排查OOM
- VictoriaMetrics常見效能問題排查
- JAVA死鎖排查-效能測試問題排查思路Java
- Redis 的高效能快取機制的三類問題:快取擊穿、快取雪崩 和 快取穿透Redis快取穿透
- 記一次 Laravel MethodNotAllowedHttpException 問題排查LaravelHTTPException
- 快取的問題快取
- 記一次線上FGC問題排查GC
- 記一次排查CPU高的問題
- 記一次OOM問題排查過程OOM
- 快取問題(一) 快取穿透、快取雪崩、快取併發 核心概念快取穿透
- 快取問題(四) 快取穿透、快取雪崩、快取併發 解決案例快取穿透
- 如何快速排查Linux伺服器效能問題Linux伺服器
- 從一次問題排查聊聊問什麼要懂原理
- 記一次失敗的 bilibili 面試總結_快取問題面試快取
- 一次IOS通知推送問題排查全過程iOS
- 記一次線上websocket返回400問題排查Web
- 記一次 Kafka 重啟失敗問題排查Kafka
- 程式碼解決快取穿透和快取雪崩問題快取穿透
- Redis快取穿透、快取雪崩、redis併發問題分析Redis快取穿透
- 【問題排查篇】一次業務問題對 ES 的 cardinality 原理探究
- Redis 面試常見問題———快取雪崩、快取擊穿以及快取穿透Redis面試快取穿透
- 記一次棧溢位異常問題的排查
- Arthas常用功能及一次線上問題排查
- 一次線上CPU高的問題排查實踐
- 記一次線上報錯日誌問題排查
- 一次郵件傳送協議SMTP問題排查協議
- 一次線上問題的排查解決過程
- 一次ygc越來越慢的問題排查過程GC
- 一次線上問題排查所引發的思考
- 如何解決快取失效問題快取
- Redis常見問題(快取雪崩)Redis快取
- tomcat伺服器快取問題Tomcat伺服器快取
- 快取 Laravel 模型的小問題快取Laravel模型
- 框架問題排查框架
- java問題排查Java
- 線上問題排查:記一次 Redis Cluster Pipeline 導致的死鎖問題Redis