常見限流演算法

jtea發表於2023-01-17

原文網址 : https://www.cnblogs.com/jtea/p/17057214.html

簡介

限流顧名思義是對流量大小進行限制，防止請求數量超過系統的負載能力，導致系統崩潰，起到保護作用。
現實生活中限流也隨處可見，節假日出門旅行的人數會劇增，對於旅遊景點來說往往會不堪重負，如果不進行人數控制，對整個景點的壓力會非常大，遊客的體驗也會非常差，還容易出現安全事故等危險。
同樣的在一線城市地鐵限流也非常常見，早高峰為了控制乘車人數和有序進站，地鐵往往會在地鐵口進行攔截，一定時間內才放行一部分人進站乘車。

具體到程式，限流可以有以下幾種場景

限制某個介面每秒最多訪問多少次
限制某個ip每秒最多訪問多少次
限制某個使用者或某個來源每秒最多訪問多少次
限制某些使用者下載速度每秒最多多少kb
禁止某些使用者或ip的訪問

限流起到了保護作用，那麼如何限呢？如果限制得太嚴，保護是保護到了，但是系統的處理能力下降了，體驗會很差；如果限制得太鬆，就會被一些突增流量衝擊到，或者被駭客利用進行安全攻擊。如何限流需要根據系統的負載來評估，系統的負載和處理能力是動態的，例如平時的qps是1000，雙11一般會進行擴容，也就是加服務節點，qps可能就是5000，這個時候系統處理能力變強的，限流策略也應該相應的調整。還有一種是出於安全的限流，例如同一個客戶端ip 1s內對系統發出上萬次請求，這種可以確定就是安全攻擊，很可能是有人惡意破壞，或者是一些爬蟲，這種可以限制請求數，超出的就直接拒絕。
如何限流是限流演算法要實現的，常見的限流演算法有“兩桶兩窗”，固定視窗、滑動視窗、漏桶與令牌桶，接下來介紹這四種演算法及應用。

固定視窗

固定視窗的思想和實現非常簡單，就是統計每個固定每個時間視窗的請求數，超過則拒絕。

如圖我們定義了視窗大小為1s，最大請求數100，視窗內超過100的請求數將被拒絕。實現上也非常簡單，利用redis的incr自增計數，當前時間秒作為快取key，每次自增後判斷是否超過指定大小即可。
固定視窗的問題是容易出現“突刺現象”，例如在1s內，100個請求都是在前100ms過來的，那麼後面的900ms的請求都會被拒絕，而系統此時是空閒的。另外還有“臨界問題”，如果100個請求是在後100ms過來的，而下一個1s的100個請求在前100ms過來，此時系統在這200ms內就需要處理200個請求，跟我們想要的不符合。到這裡我們很容易想到，1s這個範圍太大了，縮小一些就更好了，這種把固定視窗拆成更多個小視窗的做法就是滑動視窗演算法了。

滑動視窗

滑動視窗的思想是將固定視窗拆成更多個小視窗，隨著時間的推移，視窗不斷的滑動，統計也在不斷的變化。視窗拆分的越多，滑動就會越平滑，統計就會越精確，所消耗的資源就會越多。滑動視窗如果只拆為1個視窗，就退化為固定視窗。
滑動視窗演算法可以解決上面固定視窗的問題，像hystrix和sentinel中都使用該演算法進行資料統計，用於限流熔斷等策略處理。如hystrix中圖所示，在一個視窗內拆分了10個桶（bucket），隨著時間的推移，會建立新的桶也會丟棄過期的桶，當然視窗的大小和拆分桶的數量都是可配置的。

漏桶

漏桶演算法的思想是將請求先放到一個桶中，然後像滴水一樣不斷的從中取出請求執行，桶滿則溢，後面的請求會被拒絕。

漏桶演算法的特點是流入速度不確定，但是流出速度是確定的，漏桶可以很平滑，均衡的處理請求，但是無法應對短暫的突發流量。

令牌桶

令牌桶演算法的思想是不斷的生成令牌放到一個桶中，請求到來時到桶中申請令牌，申請得到就執行，申請不到就拒絕。如果桶中的令牌滿了，新生成的令牌也會丟棄。

與漏桶不同的是，令牌桶是流入速度確定(生成令牌的速度)，流出速度不確定，所以它不想漏桶一樣可以均衡的處理請求，但是由於有令牌桶這個緩衝，一旦有突增的流量，令牌桶裡已有的令牌可以短暫的應對突發流量，由於流出速度是不限制的，此時桶中已有的令牌都可以被申請到，請求一下子就會到我們的服務，給系統帶來一定的壓力，所以桶的大小需要合適，不宜過大。舉個例子：令牌桶的大小是1000，每秒放100個令牌，經過一段時間後，請求有空閒時，桶裡的令牌就會積壓，最終儲存了滿1000個令牌，由於某刻流量突增，有1000個請求到來，此時能申請到1000個令牌，所有請求都會放行，最終達到我們的系統，如果令牌桶過大，系統可能會承受不了這波請求。

應用

guava RateLimiter

guava限流實現的是桶演算法，透過RateLimiter.create建立，可以建立兩種型別的限流器，SmoothBursty和SmoothWarmingUp，前者定時生成令牌，後者有一個預熱的過程。
我們如下示例程式碼，每秒會建立2個令牌，並且初始化的時候就是2。定時器每200ms會申請一次令牌，每秒申請5次，只有2次成功，所有執行程式每秒有3次success和2次fail。

        RateLimiter rateLimiter = RateLimiter.create(2);
		new Timer().schedule(new TimerTask() {
			@Override
			public void run() {
				if (rateLimiter.tryAcquire()) {
					System.out.println("success");
				} else {
					System.out.println("fail");
				}
			}
		}, 0, 200);

既然是桶，那麼桶的大小是多少呢？SmoothBursty裡最大令牌數由maxPermits欄位表示，該欄位等於maxBurstSeconds * permitsPerSecond，permitsPerSecond是每秒要生成的令牌數，maxBurstSeconds預設是1。
另外還可以建立SmoothWarmingUp帶有預熱功能的限流器，預熱的作用是透過一個過程才達到permitsPerSecond，相當於讓系統有個熱身的時間。

		RateLimiter rateLimiter = RateLimiter.create(5, 10, TimeUnit.MILLISECONDS);
		new Timer().schedule(new TimerTask() {
			@Override
			public void run() {
				log.info("" + rateLimiter.acquire());			
			}
		}, 0, 200);

rateLimiter.acquire()返回的是獲取打令牌的時間，執行程式可以看到開始並不是每秒都能產生5個令牌，也就是不是能立刻獲取到令牌，獲取令牌需要的時間會越來越小，直到預熱期過後就能立馬獲取到令牌了。
guava的限流只能提供單機版的實現，對於叢集就無能為力了，並且它通常作為一個工具存在，使用還需要自己封裝，整合到服務，並不能開箱即用。

bucket4j

bucket4j是一個java實現，基於令牌桶演算法的限流元件。它支援分散式限流，支援多種儲存，可以方便與各種框架和監控整合。github上start 1.2K，但是issues數量少，國內估計使用的人也不多，並且官方的實現儲存不支援最常用的redis，它專注於限流，如果是自研或者二次開發，是一個很好的參考。

Resilience4j

之前我們介紹過它的熔斷功能，Resilience4j也提供了限流的實現，可以參考這裡。相比guava，Resilience4j是框架級別的，可以很方便的使用。但Resilience4j也是單機版的實現，無法支援叢集功能。
Resilience4j限流實現的是令牌桶，如下配置，每1s會生成10個令牌。

resilience4j.ratelimiter:
    instances:
        backendA:
            limitForPeriod: 10
            limitRefreshPeriod: 1s
            timeoutDuration: 0
            registerHealthIndicator: true
            eventConsumerBufferSize: 100

sentinel

流量控制是sentinel最重要的一個功能，sentinel屬於後起之秀，文件齊全，支援的場景更加豐富。sentinel支援叢集限流，也可以像guava一樣預熱，還可以基於呼叫鏈路進行限流。
sentinel還提供了控制檯功能，支援多種資料來源的持久化，使用spring cloud的話可以透過spring cloud alibaba引入sentinel。
開源版的sentinel有一些限制，並且使用起來並不是那麼方便，例如Resilience4j可以配置一個default針對所有的請求生效，但sentinel需要單個單個url去配置，顯得非常麻煩，包括熔斷feign介面的配置也是，這個給spring cloud alibaba提了feature，也許在下一個版本就會提供支援。

nginx

上面講到的都是應用級別的限流，nginx通常作為網路請求的入口，從運維的角度來說，在這裡做限流再合適不過，nginx本身也提供了限流的支援。
nginx比較適合對外的限流，但是我們內部不同系統間的呼叫一遍不經過nginx，會直接訪問到對方的閘道器，所以兩者並不矛盾。
nginx限流透過limit_req和limit_conn兩個模組支援，分別對應請求限制和連結限制（一個連結可以有多個請求）。

http {  
    limit_req_zone zone=name:10m rate=100r/s;  
    server {  
        location /app/ {
            limit_req zone=name burst=500 nodelay;
        }
}

如上，定義了一個name zone，訪問速率最高是100個每秒，/app路徑應用了這個規則。busrt表示爆發的意思，是一個緩衝佇列，用於儲存突增的請求，這些請求會被快取不會拒絕，如果超過了burst，nodelay表示不等待直接拒絕。
前面我們說到有些惡意攻擊可能每秒傳送上萬個請求，導致服務崩潰，如果多個應用系統共用一個nginx，那麼可以統一在nginx配置處理，不需要每個系統自己去實現。

limit_conn_zone $binary_remote_addr zone=name:10m;

server {    
    limit_conn name 50;    
}

如上，定義了一個name zone，$binary_remote_addr表示遠端地址，也就是ip，10m表示儲存空間，10m大概可以儲存16w的ip地址，我們在server節點應用這個規則，50表示最多50個，超過就會拒絕。

限流常見方案
2022-01-01
常見加密演算法及常見加密演算法簡述
2018-11-15
加密演算法
常見排序演算法
2024-10-10
排序演算法
基於redis實現的四種常見的限流策略
2021-06-17
Redis
js常見演算法題
2019-03-10
JS演算法
Javascript常見演算法整理
2018-09-13
JavaScript演算法
JavaScript常見演算法集合
2020-02-04
JavaScript演算法
演算法題常見模板
2024-07-01
演算法
JS常見演算法題目
2018-06-20
JS演算法
常見的排序演算法 (下)
2020-04-05
排序演算法
常見排序演算法總結
2021-03-17
排序演算法
介面限流演算法：漏桶演算法&令牌桶演算法&redis限流
2023-01-08
演算法Redis
常見的JavaScript面試演算法
2018-11-26
JavaScript面試演算法
常見國密演算法簡介
2023-10-19
演算法
常見壓縮演算法總結
2024-11-12
演算法
常見的排序演算法分析（一）
2020-12-21
排序演算法
常用限流演算法
2024-05-28
演算法
抖音無限流量卡常見問題彙總解答抖音無限流量卡資費怎樣
2018-07-05
常見演算法 PHP 實現 -- 堆排序
2018-07-22
演算法PHP排序
幾種常見排序演算法總結
2018-06-03
排序演算法
10種python常見的排序演算法！
2023-12-26
Python排序演算法
JavaScript實現常見查詢演算法
2020-11-07
JavaScript演算法
人工智慧常見演算法簡介
2019-02-15
人工智慧演算法
（新）app逆向四（常見加密演算法）
2024-07-18
APP加密演算法
常見一致性演算法
2022-01-06
演算法
常見排序演算法及複雜度
2022-03-24
排序演算法複雜度
Javascript常見排序演算法的筆記
2021-09-09
JavaScript排序演算法筆記
簡析限流演算法
2019-05-20
演算法
限流演算法介紹
2021-09-09
演算法
讓前端面試不再難（常見演算法）
2019-01-25
前端面試演算法
幾種常見的排序演算法總結
2023-11-21
排序演算法
C# 面試常見遞迴演算法
2023-12-02
C#面試遞迴演算法
幾種常見的JS遞迴演算法
2019-12-05
JS遞迴演算法
常見演算法技巧之——雙指標思想
2020-09-26
演算法指標
35.幾種常見的排序演算法
2019-02-13
排序演算法
負載均衡常見的演算法有哪些？
2024-10-18
負載演算法
Java常見排序演算法之插入排序
2021-04-12
Java排序演算法
python實現常見的五種排序演算法
2019-02-16
Python排序演算法