高併發系統設計的15個錦囊

ITPUB社群發表於2023-01-09

前言

大家好,我是田螺

記得很久之前,去面試過位元組跳動。被三面的面試官問了一道場景設計題目:如何設計一個高併發系統。當時我回答得比較粗糙,最近回想起來,所以整理了設計高併發系統的15個錦囊,相信大家看完會有幫助的。

高併發系統設計的15個錦囊

如何理解高併發系統

所謂設計高併發系統,就是設計一個系統,保證它整體可用的同時,能夠處理很高的併發使用者請求,能夠承受很大的流量衝擊

我們要設計高併發的系統,那就需要處理好一些常見的系統瓶頸問題,如記憶體不足、磁碟空間不足,連線數不夠,網路寬頻不夠等等,以應對突發的流量洪峰。

1. 分而治之,橫向擴充套件

如果你只部署一個應用,只部署一臺伺服器,那抗住的流量請求是非常有限的。並且,單體的應用,有單點的風險,如果它掛了,那服務就不可用了。

因此,設計一個高併發系統,我們可以分而治之,橫向擴充套件。也就是說,採用分散式部署的方式,部署多臺伺服器,把流量分流開,讓每個伺服器都承擔一部分的併發和流量,提升整體系統的併發能力

2. 微服務拆分(系統拆分)

要提高系統的吞吐,提高系統的處理併發請求的能力。除了採用分散式部署的方式外,還可以做微服務拆分,這樣就可以達到分攤請求流量的目的,提高了併發能力。

所謂的微服務拆分,其實就是把一個單體的應用,按功能單一性,拆分為多個服務模組。比如一個電商系統,拆分為使用者系統、訂單系統、商品系統等等

高併發系統設計的15個錦囊

3. 分庫分表

當業務量暴增的話,MySQL單機磁碟容量會撐爆。並且,我們知道資料庫連線數是有限的。在高併發的場景下,大量請求訪問資料庫,MySQL單機是扛不住的!高併發場景下,會出現too many connections報錯。

所以高併發的系統,需要考慮拆分為多個資料庫,來抗住高併發的毒打。而假如你的單表資料量非常大,儲存和查詢的效能就會遇到瓶頸了,如果你做了很多最佳化之後還是無法提升效率的時候,就需要考慮做分表了。一般千萬級別資料量,就需要分表,每個表的資料量少一點,提升SQL查詢效能。

當面試官問要求你設計一個高併發系統的時候,一般都要說到分庫分表這個點。

之前寫了分庫分表15連問,為了應對面試官追問到底,大家可以順便複習一下分庫分表的相關經典面試題哈,可以看我這篇文章:分庫分表經典15連問

4. 池化技術

在高併發的場景下,資料庫連線數可能成為瓶頸,因為連線數是有限的。

我們的請求呼叫資料庫時,都會先獲取資料庫的連線,然後依靠這個連線來查詢資料,搞完收工,最後關閉連線,釋放資源。如果我們不用資料庫連線池的話,每次執行SQL,都要建立連線和銷燬連線,這就會導致每個查詢請求都變得更慢了,相應的,系統處理使用者請求的能力就降低了。

因此,需要使用池化技術,即資料庫連線池、HTTP 連線池、Redis 連線池等等。使用資料庫連線池,可以避免每次查詢都新建連線,減少不必要的資源開銷,透過複用連線池,提高系統處理高併發請求的能力

同理,我們使用執行緒池,也能讓任務並行處理,更高效地完成任務。大家可以看下我之前執行緒池的這篇文章,到時候面試官問到這塊時,剛好可以擴充套件開來講

  • 面試必備:Java執行緒池解析
  • 細數執行緒池的10個坑

5. 主從分離

通常來說,一臺單機的MySQL伺服器,可以支援500左右的TPS10000左右的QPS,即單機支撐的請求訪問是有限的。因此你做了分散式部署,部署了多臺機器,部署了主資料庫、從資料庫。

但是,如果雙十一搞活動,流量肯定會猛增的。如果所有的查詢請求,都走主庫的話,主庫肯定扛不住,因為查詢請求量是非常非常大的。因此一般都要求做主從分離,然後實時性要求不高的讀請求,都去讀從庫,寫的請求或者實時性要求高的請求,才走主庫。這樣就很好保護了主庫,也提高了系統的吞吐。

當然,如果回答了主從分離,面試官可能擴充套件開問你主從複製原理,問你主從延遲問題等等,這塊大家需要全方位複習好哈。可以去看看我之前的這篇文章

面試必備:聊聊MySQL的主從

6. 使用快取

無論是作業系統,瀏覽器,還是一些複雜的中介軟體,你都可以看到快取的影子。我們使用快取,主要是提升系統介面的效能,這樣高併發場景,你的系統就可以支援更多的使用者同時訪問。

常用的快取包括:Redis快取,JVM本地快取,memcached等等。就拿Redis來說,它單機就能輕輕鬆鬆應對幾萬的併發,你讀場景的業務,可以用快取來抗高併發。

快取雖然用得爽,但是要注意快取使用的一些問題

  • 快取與資料庫的一致性問題
  • 快取雪崩
  • 快取穿透
  • 快取擊穿

如果大家打算使用Redis的話,需要知道一些注意點,可以看下我之前的這篇文章哈,挺好的。使用Redis,你必須知道的21個注意要點

7. CDN,加速靜態資源訪問

商品圖片,icon等等靜態資源,可以對頁面做靜態化處理,減少訪問服務端的請求。如果使用者分佈在全國各地,有的在上海,有的在深圳,地域相差很遠,網速也各不相同。為了讓使用者最快訪問到頁面,可以使用CDNCDN可以讓使用者就近獲取所需內容。

什麼是CDN?

Content Delivery Network/Content Distribution Network,翻譯過來就是內容分發網路,它表示將靜態資源分發到位於多個地理位置機房的伺服器,可以做到資料就近訪問,加速了靜態資源的訪問速度,因此讓系統更好處理正常別的動態請求。

8. 訊息佇列,削鋒

我們搞一些雙十一、雙十二等運營活動時,需要避免流量暴漲,打垮應用系統的風險。因此一般會引入訊息佇列,來應對高併發的場景

高併發系統設計的15個錦囊

假設你的應用系統每秒最多可以處理2k個請求,每秒卻有5k的請求過來,可以引入訊息佇列,應用系統每秒從訊息佇列拉2k請求處理得了。

有些夥伴擔心這樣可能會出現訊息積壓的問題:

  • 首先,搞一些運營活動,不會每時每刻都那麼多請求過來你的系統(除非有人惡意攻擊),高峰期過去後,積壓的請求可以慢慢處理;
  • 其次,如果訊息佇列長度超過最大數量,可以直接拋棄使用者請求或跳轉到錯誤頁面;

9. ElasticSearch

Elasticsearch,大家都使用得比較多了吧,一般搜尋功能都會用到它。它是一個分散式、高擴充套件、高實時的搜尋與資料分析引擎,簡稱為ES

我們在聊高併發,為啥聊到ES呢?因為ES可以擴容方便,天然支撐高併發。當資料量大的時候,不用動不動就加機器擴容,分庫等等,可以考慮用ES來支援簡單的查詢搜尋、統計類的操作。

10. 降級熔斷

熔斷降級是保護系統的一種手段。當前網際網路系統一般都是分散式部署的。而分散式系統中偶爾會出現某個基礎服務不可用,最終導致整個系統不可用的情況, 這種現象被稱為服務雪崩效應

比如分散式呼叫鏈路A->B->C....,下圖所示:

高併發系統設計的15個錦囊

如果服務C出現問題,比如是因為慢SQL導致呼叫緩慢,那將導致B也會延遲,從而A也會延遲。堵住的A請求會消耗佔用系統的執行緒、IO、CPU等資源。當請求A的服務越來越多,佔用計算機的資源也越來越多,最終會導致系統瓶頸出現,造成其他的請求同樣不可用,最後導致業務系統崩潰。

為了應對服務雪崩, 常見的做法是熔斷和降級。最簡單是加開關控制,當下遊系統出問題時,開關開啟降級,不再呼叫下游系統。還可以選用開源元件Hystrix來支援。

你要保證設計的系統能應對高併發場景,那肯定要考慮熔斷降級邏輯進來。

11. 限流

限流也是我們應對高併發的一種方案。我們當然希望,在高併發大流量過來時,系統能全部請求都正常處理。但是有時候沒辦法,系統的CPU、網路頻寬、記憶體、執行緒等資源都是有限的。因此,我們要考慮限流。

如果你的系統每秒扛住的請求是一千,如果一秒鐘來了十萬請求呢?換個角度就是說,高併發的時候,流量洪峰來了,超過系統的承載能力,怎麼辦呢?

這時候,我們可以採取限流方案。就是為了保護系統,多餘的請求,直接丟棄。

什麼是限流:在計算機網路中,限流就是控制網路介面傳送或接收請求的速率,它可防止DoS攻擊和限制Web爬蟲。限流,也稱流量控制。是指系統在面臨高併發,或者大流量請求的情況下,限制新的請求對系統的訪問,從而保證系統的穩定性。

可以使用GuavaRateLimiter單機版限流,也可以使用Redis分散式限流,還可以使用阿里開源元件sentinel限流。

面試的時候,你說到限流這塊的話?面試官很大機率會問你限流的演算法,因此,大家在準備面試的時候,需要複習一下這幾種經典的限流演算法哈,可以看下我之前的這篇文章,面試必備:4種經典限流演算法講解

12. 非同步

回憶一下什麼是同步,什麼是非同步呢?以方法呼叫為例,它代表呼叫方要阻塞等待被呼叫方法中的邏輯執行完成。這種方式下,當被呼叫方法響應時間較長時,會造成呼叫方長久的阻塞,在高併發下會造成整體系統效能下降甚至發生雪崩。非同步呼叫恰恰相反,呼叫方不需要等待方法邏輯執行完成就可以返回執行其他的邏輯,在被呼叫方法執行完畢後再透過回撥、事件通知等方式將結果反饋給呼叫方。

因此,設計一個高併發的系統,需要在恰當的場景使用非同步。如何使用非同步呢?後端可以借用訊息佇列實現。比如在海量秒殺請求過來時,先放到訊息佇列中,快速響應使用者,告訴使用者請求正在處理中,這樣就可以釋放資源來處理更多的請求。秒殺請求處理完後,通知使用者秒殺搶購成功或者失敗。

13. 介面的常規最佳化

設計一個高併發的系統,需要設計介面的效能足夠好,這樣系統在相同時間,就可以處理更多的請求。當說到這裡的話,可以跟面試官說說介面最佳化的一些方案了。大家可以看下我的這篇文章哈:實戰總結!18種介面最佳化方案的總結

高併發系統設計的15個錦囊

14. 壓力測試確定系統瓶頸

設計高併發系統,離不開最重要的一環,就是壓力測試。就是在系統上線前,需要對系統進行壓力測試,測清楚你的系統支撐的最大併發是多少,確定系統的瓶頸點,讓自己心裡有底,最好預防措施。

壓測完要分析整個呼叫鏈路,效能可能出現問題是網路層(如頻寬)、Nginx層、服務層、還是資料路快取等中介軟體等等。

loadrunner是一款不錯的壓力測試工具,jmeter則是介面效能測試工具,都可以來做下壓測。

15. 應對突發流量峰值:擴容+切流量

如果是突發的流量高峰,除了降級、限流保證系統不跨,我們可以採用這兩種方案,保證系統儘可能服務使用者請求:

  • 擴容:比如增加從庫、提升配置的方式,提升系統/元件的流量承載能力。比如增加MySQL、Redis從庫來處理查詢請求。
  • 切流量:服務多機房部署,如果高併發流量來了,把流量從一個機房切換到另一個機房。

參考與感謝

  • 極客時間高併發系統設計 40 問[1]

參考資料

[1]

極客時間高併發系統設計 40 問:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70024420/viewspace-2931347/,如需轉載,請註明出處,否則將追究法律責任。

相關文章