微服務分散式系統熔斷實戰-為何我們需要API級別熔斷？

二手雄獅發表於2018-10-31

原文網址 : https://juejin.im/post/5bd4169c6fb9a05cf9087a5c

微服務分散式API

熔斷在分散式系統的作用已經被強調過很多次了

可以通過這篇文章來了解價值,Netflix在自己的分散式系統中應用熔斷技術來保護系統

blog.51cto.com/developeryc…

內部的實現機制可以參考

martinfowler.com/bliki/Circu…

本篇文章將介紹go chassis如何通過熔斷機制，隔離上游服務，保護下游服務。

Go chassis如何保證上游錯誤不影響下游系統

go chassis引用幷包裝了https://github.com/afex/hystrix-go帶來了熔斷和降級功能。

當執行時內部處理中的協程達到一定閾值，錯誤率達到一定閾值，或者超時達到一定閾值時，就會觸發熔斷，使用者可按需定製調教熔斷器配置項設定這些引數。

hystrix-go內部的熔斷邏輯

go chassis使用統一的invocation抽象來代表每一次遠端呼叫，hystrix-go使用command抽象來封裝任何一個執行片段，invocation會被強制封裝到command中，並在一個circuit中執行。

每個Circuit都是唯一的Name，並且有一個Ticket桶，用來存放ticket，一開始它是關閉狀態，即一切運轉正常

呼叫將被強制性的包裝進入circuit獨立協程池中，並領取一個ticket。

command最終只有2種狀態，超時，或者完成。每當達到這兩個狀態就會歸還ticket

在這裡可以看到ticket機制其實跟限流中的令牌桶演算法很像。

當超時或者拿不到ticket時就會被記為一次錯誤，當錯誤達到一定閾值，circuit就會開啟，拒絕傳送網路請求

服務級別隔離

每個service內部會有多個circuit，每個circuit對應一個上游微服務。當service3出現問題時（如死鎖，或是併發量太大），將物理進行隔絕，即不再傳送任何請求，以保證系統健康，service1依然可以正常和2,4互動，保證大部分業務正常。

這麼來看還是很理想的，serivce3的錯誤呼叫不至於拖垮service1（如果死鎖了，很容易就拖垮service1，導致這個由四個服務組成的系統癱瘓），但真的如此麼，讓我們看看層級複雜些的系統。

為何服務級別隔離還不夠？

每個服務都是基於go chassis開發的

假設api2需要呼叫service4完成，api1呼叫3完成，api3呼叫5完成

service4內的死鎖導致api2失敗了，最終觸發熔斷。service1將整個service2全部隔離了，導致一個小小的死鎖，引發了系統快速失敗。

看上去熔斷在這裡反而起到了壞的效果，那讓我們看看沒熔斷會發生什麼

不加入熔斷

這時就看哪個客戶端做了超時處理了，因為死鎖的存在，會導致整條呼叫鏈路掛死，最終導致客戶端埠耗盡後，進而快速失敗

現在來看，死鎖在一個不健壯的系統中是一定會拖垮整個分散式系統的，無解

有熔斷和沒熔斷效果都一樣，最終都是快速失敗。那麼如何解決

API級別熔斷

每個circuit只負責一個API的執行，監控，隔離

當service2呼叫service4時，單獨的介面進入到隔離狀態而不影響其他API呼叫。

總結

通過這篇文章我們知道了服務級別的錯誤隔離是不夠的，結構不復雜的系統尚可接受，但是複雜後不能因為一個API的錯誤而隔離整個服務，而是細粒度的進行隔離。go chassis提供了API級別熔斷幫助開發者快速隔離問題服務。

熔斷的手段有超時實踐，併發數，錯誤率等。它強制性的保護起每一次遠端呼叫，無需開發者自己編寫程式碼處理超時，死鎖，網路錯誤等問題，解放了開發者，讓他們更多的去關注業務程式碼而不是分散式系統帶來的複雜性

專案資料

go chassis開發框架：https://github.com/go-chassis/go-chassis

熔斷文件：https://go-chassis.readthedocs.io/en/latest/user-guides/cb-and-fallback.html

go chassis系列文章：

https://juejin.im/post/5ba34495e51d450e9e440d1f

https://juejin.im/post/5ba460556fb9a05d2469bb81

分散式熔斷降級平臺aegis
2019-02-21
分散式
分散式服務防雪崩熔斷器，Hystrix理論+實戰。
2018-12-02
分散式
微服務SpringCloud之熔斷器
2019-07-14
微服務SpringGCCloud
微服務熔斷限流Hystrix之Dashboard
2019-05-06
微服務
微服務熔斷限流Hystrix之流聚合
2019-05-08
微服務
Java後端分散式系統的服務降級：優雅降級與服務熔斷
2024-08-28
Java後端分散式
go-kit微服務：服務熔斷
2019-03-05
Go微服務
微服務11：熔斷、降級的Hystrix實現（附原始碼）
2022-12-20
微服務原始碼
.NET Core 微服務之Polly熔斷策略
2019-06-26
微服務
服務的熔斷和降級的區別
2020-04-05
利用Spring Boot實現微服務的API閘道器統一限流與熔斷
2024-08-24
Spring Boot微服務API
Sentinel限流熔斷降級
2022-11-13
微服務元件之限流器與熔斷器
2018-06-21
微服務元件
聊聊微服務：Hystrix熔斷機制和原理
2024-12-10
微服務
[分散式][高併發]熔斷策略和最佳實踐
2019-02-20
分散式
SpringCloud-Hystrix 服務降級、熔斷
2020-04-24
SpringGCCloud
五. SpringCloud服務降級與熔斷
2021-02-28
SpringGCCloud
.Net Core微服務——Ocelot（3）：超時、熔斷、限流
2021-11-16
微服務
Envoy熔斷限流實踐（一）基於Rainbond外掛實現熔斷
2022-04-19
AI
熔斷原理與實現
2020-10-26
Hystrix--熔斷
2020-10-02
Spring Cloud實戰系列(四) - 熔斷器Hystrix
2019-01-30
SpringCloud
微服務熔斷隔離機制及注意事項
2018-12-03
微服務
微服務SpringCloud之熔斷監控Hystrix Dashboard和Turbine
2019-07-21
微服務SpringGCCloud
微服務技術棧：流量整形演算法，服務熔斷與降級
2020-06-28
微服務演算法
SpringCloud Netflix (五) : Hystrix 服務熔斷和服務降級
2020-05-18
SpringGCCloud
SpringCloud微服務實戰——搭建企業級開發框架（十五）：整合Sentinel高可用流量管理框架【熔斷降級】
2021-11-05
SpringGCCloud微服務框架
《面試補習》-熔斷降級我學會了！
2021-07-10
面試
分散式系統關注點——99%的人都能看懂的「熔斷」以及最佳實踐
2018-11-19
分散式
Sentinel入門到實操 (限流熔斷降級)
2023-02-13
微服務架構 | 5.2 基於 Sentinel 的服務限流及熔斷
2022-01-30
微服務架構
（萬字好文）Dubbo服務熔斷與降級的深入講解&程式碼實戰
2021-01-30
微服務架構 | 5.4 Sentinel 流控、統計和熔斷的原始碼分析
2022-01-31
微服務架構原始碼
Spring cloud(4)-熔斷(Hystrix)
2018-10-24
SpringCloud
springcloud(四)：熔斷器Hystrix
2018-11-29
SpringGCCloud
springcloud之Hystrix熔斷器
2020-04-07
SpringGCCloud
面試官：說說降級、熔斷、限流
2019-05-05
面試
一個故事理解限流熔斷降級
2024-09-12