記,一次線上商城系統高併發的優化!
對於線上系統調優,它本身是個技術活,不僅需要很強的技術實戰能力,很強的問題定位,問題識別,問題排查能力,還需要很豐富的調優能力。
本篇文章從實戰角度,從問題識別,問題定位,問題分析,提出解決方案,實施解決方案,監控調優後的解決方案和調優後的觀察等角度來與大家一起交流分享本次線上高併發調優整個閉環過程。
一 專案簡要情況概述
該專案為基於SSM架構的商城類單體架構專案,其中有一個秒殺重磅模組,如下為當前線上環境的簡要架構部署圖,大致描述一下:
(1)專案為SSM架構
(2)伺服器類別:1臺負載均衡伺服器(F5),3臺運用程式伺服器,1臺計時器伺服器,1臺redis伺服器,1臺圖片服伺服器和1臺基於Pass架構的Mysql主從伺服器(微軟雲)
(3)呼叫邏輯:下圖為簡要呼叫邏輯
二 何為單體架構專案
從架構發展角度,軟體專案經歷瞭如下階段的發展:
1.單體架構:可理解為傳統的前後端未分離的架構
2.垂直架構:可理解為前後端分離架構
3.SOA架構:可理解為按服務類別,業務流量,服務間依賴關係等服務化的架構,如以前的單體架構ERP專案,劃分為訂單服務,採購服務,物料服務和銷售服務等
4 微服務:可理解為一個個小型的專案,如之前的ERP大型專案,劃分為訂單服務(訂單專案),採購服務(採購專案),物料服務(物料專案)和銷售服務(銷售專案),以及服務之間呼叫
三 本SSM專案引發的線上問題
問題一:當秒殺的時候,cpu暴增。
該系統每天秒殺分為三個時間段:10點,13點和20點,如下為秒殺的簡要頁面
圖1
圖2
圖3
2.單臺運用伺服器cpu
3.單臺運用伺服器請求數
4.rdis連線數(info clients)
這個未儲存截圖,記得是600左右
connected_clients:600
5.mysql請求截圖
四 排查過程及分析
(一)排查思路。
根據服務部署和專案架構,從如下幾個方面排查:
(1)運用伺服器:排查記憶體,cpu,請求數等;
(2)檔案圖片伺服器:排查記憶體,cpu,請求數等;
(3)計時器伺服器:排查記憶體,cpu,請求數等;
(4)redis伺服器:排查記憶體,cpu,連線數等;
(5)db伺服器:排查記憶體,cpu,連線數等;
(二)排查過程
在秒殺後30分鐘內,
1.運用程式伺服器cpu暴增,記憶體暴增,造成cpu和記憶體暴增的根本原因是請求數過高,單臺運用伺服器達到3000多;
2.redis請求超時
3.jdbc連線超時
4.通過gc檢視,發現24小時內,FullGC發生了152次
5.再看看堆疊,發現有一些執行緒阻塞和死鎖
jstat -l pid,也可以通過VisualVM分析
6.發現有2000多個執行緒請求無效資源
(三)造成本次系統異常主要因素分析
(1)在秒殺時,請求量過高,導致運用伺服器負載過高;
(2)redis連線池滿,獲取不到連線,connot get a connection from thread pool
(3)jdbc連線池滿,獲取不到連線和超時
(4)存在大物件程式碼,如向list集合中不停新增物件,不能及時回收物件導致記憶體增加,頻繁發生Full GC
(5)tomcat併發引數,jvm優化引數,jedis配置引數,jdbc配置引數不合理
(6)未對請求量進行削峰和限流
(7)資源連線未及時釋放,如redis連線,jdbc連線未及時釋放
五 最終解決方案
1.增加運用服務,做流量削峰和分流
由於該專案未增加MQ,因此只能採用硬負載,增加伺服器水平擴充套件方式來實現流量削峰和流量分流
2.優化jvm引數,如下為本次優化後的引數
JAVA_OPTS="-server -Xmx9g -Xms9g -Xmn3g -Xss500k -XX:+DisableExplicitGC -XX:MetaspaceSize=2048m -XX:MaxMetaspaceSize=2048m -XX:+UseConcMarkSweepGC -XX:+CMSParallelRemarkEnabled -XX:LargePageSizeInBytes=128m -XX:+UseFastAccessorMethods -XX:+UseCMSInitiatingOccupancyOnly -XX:CMSInitiatingOccupancyFraction=70 -Dfile.encoding=UTF8 -Duser.timezone=GMT+08"
關於這個jvm引數的優化,jvm理論是怎樣的,官方建議是怎樣的,實戰是怎樣的,將在下篇文章中分析。
3.優化tomcat併發相關引數
主要是兩方面:
(1)修改bio協議為nio2 (2)根據伺服器配置,業務場景,業務流量等合理設定相關引數,儘量達到最優
關於tomcat相關引數優化,在接下來的文章中分析。
4.redis 和jdbc引數優化
由於涉及到安全性問題,這裡不列出
5.程式碼優化
(1)優化掉大物件
(2)優化未及時釋放的物件和連線資源
6.解決000多個執行緒請求無效資源問題
在conf/context.xml增大快取
<Resource
cachingAllowed = "true"
cacheMaxSize = "102400"
/>
六 最終優化結果
經過幾天觀察,系統平穩
1.基本監控
2.GC
3.抽樣器cou和記憶體
cpu
記憶體
七 總結
1.本篇文章從實戰角度,從問題識別,問題定位,問題分析,提出解決方案,實施解決方案,監控調優後的解決方案和調優後的觀察等角度來與大家一起交流分享本次線上高併發調優整個閉環過程,當然,由於篇幅的限制,
有些細節和優化手段未在本篇文章中提及;
2.雖然解決了該問題,但是從長遠來看,該單體專案仍然存在很大的問題和隱患,下面隨便舉幾個:
(1)前後端緊耦合,未分離
(2)由於該系統秒殺業務屬於非持續性併發,即區域性性併發,當前並未做區域性併發架構的調整
(3)由於該系統秒殺業務與該專案緊緊耦合在一起,未進行隔離,未獨立成單獨模組,未單獨部署,從而存在因秒殺業務造成整個系統癱瘓的風險;
(4)未做流量削峰和流量限流,如加mq等軟手段;
(5)redis未做高可用叢集
相關文章
- 記一次線上商城系統高併發的優化優化
- 高併發IM系統架構優化實踐架構優化
- 高併發&效能優化(二)------系統監控工具使用優化
- 線上Redis高併發效能調優實踐Redis
- 高併發優化方向優化
- 高併發,大資料量系統的資料結構優化思路大資料資料結構優化
- 搭建高併發、高可用的系統
- Laravel 高併發調優筆記Laravel筆記
- 線上賬務系統餘額併發更新問題記錄
- 淺談高併發-前端優化前端優化
- Java高併發實戰,鎖的優化Java優化
- 非同步程式設計CompletableFuture實現高併發系統優化之請求合併非同步程式設計優化
- 記一次服務端系統效能優化服務端優化
- (四)Java高併發秒殺API之高併發優化JavaAPI優化
- [php]如何做到高併發優化PHP優化
- Nginx+php-fpm高併發優化NginxPHP優化
- 6步帶你用Spring Boot開發出商城高併發秒殺系統Spring Boot
- Go語言構建千萬級線上的高併發訊息推送系統實踐Go
- 【高併發】高併發環境下如何優化Tomcat效能?看完我懂了!優化Tomcat
- 高併發服務的幾條優化經驗優化
- 高併發&效能優化(一)------總體介紹優化
- 使用線上教育SaaS系統的優勢
- 六個線上CRM系統的優勢
- 高併發系統限流中的演算法演算法
- 【高併發】面試官:講講高併發場景下如何優化加鎖方式?面試優化
- 慧優米商城系統開發原始碼部署原始碼
- 線上CRM系統的安全性高嗎?
- [分散式][高併發]熱點快取的架構優化分散式快取架構優化
- 高併發場景下如何優化伺服器的效能?優化伺服器
- Random在高併發下的缺陷以及JUC對其的優化random優化
- 高併發中nginx較優的配置Nginx
- 高併發系統設計的15個錦囊
- 【高併發寫】庫存系統設計
- 高併發系統之大忌-慢查詢
- 【高併發優化實踐】10倍請求壓力來襲,你的系統會被擊垮嗎?【石杉的架構筆記】優化架構筆記
- 移動spa商城優化記(一)---首屏優化篇優化
- 秀出天際!阿里技術官甩我臉上的Java高併發秒殺系統筆記,太牛了,好想再被甩一次!阿里Java筆記
- 【效能優化之道】每秒上萬併發下的Spring Cloud引數優化實戰優化SpringCloud