阿里雙11秒殺如何設計?

ITPUB社群發表於2023-11-06

來源:mikechen的網際網路架構

大家好,我是mikechen。


秒殺是電商業務裡的標誌性事件,馬上雙11秒殺又要開始了。這樣的典型高併發場景會遇見什麼樣的挑戰呢,然後又是如何來解決的呢?本篇我就來重點詳解秒殺的設計@mikechen


秒殺活動場景

淘寶雙11秒殺場景,大量的使用者短時間內湧入,瞬間流量巨大(高併發),比如:1000萬人同一時間搶購100件商品。秒殺活動是一個特別考驗後臺資料庫、快取服務的業務,對於資料庫、快取的效能要求特別嚴格。

阿里雙11秒殺如何設計?

秒殺背後的技術挑戰

1、突增的伺服器及網路需求

通常情況下,雙 11 的伺服器使用是平時的 3-5 倍,網路頻寬是平時 N倍。

2、業務高併發,服務負載重

我們通常衡量一個 Web 系統的吞吐率的指標是 QPS(Query Per Second,每秒處理請求數),解決每秒數萬次的高併發場景,這個指標非常關鍵。

假設處理一個業務請求平均響應時間為 100 ms,同時,系統內有 20 臺 Web 伺服器,配置最大連線數為 500 個,Web 系統的理論峰值 QPS 為(理想化的計算方式):100000 (10萬QPS)意味著1 秒鐘可以處理完 10 萬的請求,而“秒殺”的那 5w/s 的秒殺似乎是“紙老虎”。

實際情況,在高併發的實際場景下,伺服器處於高負載的狀態,網路頻寬被擠滿,在這個時候平均響應時間會被大大增加。隨著使用者數量的增加,資料庫連線程式增加,需要處理的上下文切換也越多,伺服器造成負載壓力越來越重。

3、業務耦合度高,引起系統“雪崩”

更可怕的問題是,當系統上某個應用因為延遲而變得不可用,使用者的點選越頻繁,惡性迴圈最終導致“雪崩”,因為其中一臺伺服器掛了,導致流量分散到其他正常工作的機器上,再導致正常的機器也掛,然後惡性迴圈,將整個系統拖垮。

如何解決秒殺技術瓶頸

秒殺架構設計思路:

阿里雙11秒殺如何設計?

將請求攔截在系統上游,降低下游壓力:秒殺系統特點是併發量極大,但實際秒殺成功的請求數量卻很少,所以如果不在前端攔截很可能造成資料庫讀寫鎖衝突,甚至導致死鎖,最終請求超時。

充分利用快取(redis):利用快取可極大提高系統讀寫速度。

訊息中介軟體(RocketMQ、Kafka等):訊息佇列可以削峰,將攔截大量併發請求,這也是一個非同步處理過程,後臺業務根據自己的處理能力,從訊息佇列中主動的拉取請求訊息進行業務處理。

前端設計方案

  • 頁面靜態化:將活動頁面上的所有可以靜態的元素全部靜態化,並儘量減少動態元素。透過CDN來抗峰值。

  • 禁止重複提交:使用者提交之後按鈕置灰,禁止重複提交

  • 使用者限流:在某一時間段內只允許使用者提交一次請求,比如可以採取IP限流

後端設計方案

  • 服務端控制器層(閘道器層)

  • 限制uid(UserID)訪問頻率:我們上面攔截了瀏覽器訪問的請求,但針對某些惡意攻擊或其它外掛,在服務端控制層需要針對同一個訪問uid,限制訪問頻率。

  • 服務層

上面只攔截了一部分訪問請求,當秒殺的使用者量很大時,即使每個使用者只有一個請求,到服務層的請求數量還是很大。比如我們有100W使用者同時搶100臺手機,服務層併發請求壓力至少為100W。

  • 採用訊息佇列快取請求:既然服務層知道庫存只有100臺手機,那完全沒有必要把100W個請求都傳遞到資料庫啊,那麼可以先把這些請求都寫到訊息佇列快取一下,資料庫層訂閱訊息減庫存,減庫存成功的請求返回秒殺成功,失敗的返回秒殺結束。

  • 利用快取應對讀請求:比如雙11秒殺搶購,是典型的讀多寫少業務,大部分請求是查詢請求,所以可以利用快取分擔資料庫壓力。

  • 利用快取應對寫請求:快取也是可以應對寫請求的,比如我們就可以把資料庫中的庫存資料轉移到Redis快取中,所有減庫存操作都在Redis中進行,然後再透過後臺程式把Redis中的使用者秒殺請求同步到資料庫中。

資料庫層

資料庫層是最脆弱的一層,一般在應用設計時在上游就需要把請求攔截掉,資料庫層只承擔“能力範圍內”的訪問請求。所以,上面透過在服務層引入佇列和快取,讓最底層的資料庫高枕無憂。

比如:利用訊息中介軟體和快取實現簡單的秒殺系統

Redis是一個分散式快取系統,支援多種資料結構,我們可以利用Redis輕鬆實現一個強大的秒殺系統。

我們可以採用Redis 最簡單的key-value資料結構,用一個原子型別的變數值(AtomicInteger)作為key,把使用者id作為value,庫存數量便是原子變數的最大值。對於每個使用者的秒殺,我們使用 RPUSH key value插入秒殺請求, 當插入的秒殺請求數達到上限時,停止所有後續插入。

然後我們可以在臺啟動多個工作執行緒,使用 LPOP key 讀取秒殺成功者的使用者id,然後再運算元據庫做最終的下訂單減庫存操作。

當然,上面Redis也可以替換成訊息中介軟體如RocketMQ、Kafka等,也可以將快取和訊息中介軟體 組合起來,快取系統負責接收記錄使用者請求,訊息中介軟體負責將快取中的請求同步到資料庫。

秒殺架構設計總結:

  1. 限流:鑑於只有少部分使用者能夠秒殺成功,所以要限制大部分流量,只允許少部分流量進入服務後端。

  2. 削峰:對於秒殺系統瞬時會有大量使用者湧入,所以在搶購一開始會有很高的瞬間峰值。高峰值流量是壓垮系統很重要的原因,所以如何把瞬間的高流量變成一段時間平穩的流量也是設計秒殺系統很重要的思路。實現削峰的常用的方法有利用快取和訊息中介軟體等技術。

  3. 非同步處理:秒殺系統是一個高併發系統,採用非同步處理模式可以極大地提高系統併發量,其實非同步處理就是削峰的一種實現方式。

  4. 記憶體快取:秒殺系統最大的瓶頸一般都是資料庫讀寫,由於資料庫讀寫屬於磁碟IO,效能很低,如果能夠把部分資料或業務邏輯轉移到記憶體快取,效率會有極大地提升。

  5. 可擴充:當然如果我們想支援更多使用者,更大的併發,最好就將系統設計成彈性可擴充的,如果流量來了,擴充機器就好了。像淘寶、京東等雙十一活動時會增加大量機器應對交易高峰。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70024420/viewspace-2992985/,如需轉載,請註明出處,否則將追究法律責任。

相關文章