Dubbo 2.7.1 踩坑記

good_andyxu發表於2019-05-16

Dubbo 2.7 版本增加新特性,新系統開始使用 Dubbo 2.7.1 嚐鮮新功能。使用過程中不慎踩到這個版本的 Bug。

系統架構

Spring Boot 2.14-Release + Dubbo 2.7.1

現象

Dubbo 服務者啟動成功,正常提供服務,消費者呼叫偶現失敗的情況。錯誤如下圖:

呼叫失敗

可以看出,主要原因為 cause: message can not send, because channel is closed。 但是檢查提供者,卻發現服務程式正常。

登陸 Dubbo admin 檢視提供者服務,發現這個服務存在兩個節點。

Dubbo admin

192.168.164.77 為測試伺服器的 ip,提供者位於這臺機器,而另一個 10.20.80.67 卻是本地電腦的 IP,但是此時本地並未執行這個服務。

再次檢視服務報錯的原因,可以看到提供者呼叫l本地提供 RPC 的服務。由於本地服務已停止,導致呼叫失敗。

這個問題在之前版本從未碰到,剛開始隱約記得 Dubbo 服務提供者註冊使用 ZooKeeper 臨時節點,服務斷開,會刪除該節點。

問題原因

在 Dubbo 主頁搜尋相關 issue,看到同樣的問題 Dubbo-2.7.1 providers 重複註冊.

檢視相關回復,可以看到問題主要由於 dynamic 預設值變成 false ,而 2.7.1 之前版本預設不賦值,初始值為 null。

問題原因

後續 PR 中已修復該問題 Fix issue 3785,修復程式碼將 dynamic 預設設定成 true。但是截止 20190515 該版本暫未釋出。

原始碼分析

知道問題原因,這裡我們從原始碼分析一下,為什麼 dynamic 設定成 false 會導致該問題。

注:下面分析的是 Dubbo 2.7.1 的原始碼
下面我們使用 Dubbo xml 配置相關。

在 xml 配置中,可以在以下兩個地方設定 dynamic 屬性。

xml 配置

服務啟動時將會使用 DubboNamespaceHandler 解析,注入 Spring 容器。

DubboNamespaceHandler 解析過程

其中會將 provider 標籤解析成 ProviderConfig 物件,service 標籤解析成 ServiceBean 物件。

繼承關係

檢視繼承關係,可以看到以上兩個類都繼承 AbstractServiceConfig , dynamic 位於這個父物件中。

dynamic 預設值

可以看到該欄位預設值為 false

接著檢視 Dubbo 服務匯出過程,位於 ServiceBean#export,略過其他程式碼,我們直接跳到關鍵 ServiceConfig#doExportUrlsFor1Protocol

doExportUrlsFor1Protocol

可以看到這裡呼叫了多次 appendParameters 方法。 這個方法將利用反射,獲取物件的中所有欄位資訊,然後新增到 map 中。其中欄位名字為鍵值,欄位實際值為內容。此時 map 鍵值內容為:

map 內容

可以看到 map 中還有一個 default.dynamic,大家翻看程式碼自己思考一下,為什麼會出現這個?

接著我們跳到後面:

url

在這裡會將上面得到 map 組裝到 URL 物件中,然後再註冊到註冊中心。。

由於註冊中心使用的是 ZooKeeper,所以這裡將會使用 ZookeeperRegistry 實現類。

doRegister

首先檢視 url##getParameter 方法,這裡 Constants.DYNAMIC_KEY 值為 dynamic。

url##getParameter

該方法會先從 parameters 中根據鍵值取值。若不存在,會再根據 default 作為字首拼接再次取值。若還不存在則使用傳入的預設值。

檢視此時的 parameters 物件。

parameters

url.getParameter(Constants.DYNAMIC_KEY, true) 返回為 false。

然後分析 zkClient#create 方法,

zkClient#create

由於 ephemeral 為 false,所以這個服務註冊到 ZooKeeper 的節點為持久節點。

臨時節點,客戶端斷開,會話超時後,ZooKeeper 將會自動刪除這個節點。zookeeper-faq
面試題:服務提供者能實現失效踢出是什麼原理(高頻題)

服務當機的時候,該節點由於是持久節點會永遠存在,而且當服務再次重啟的時候會將重新註冊一個新節點。這樣就導致 ZooKeeper 中存在額外失效的節點,且該節點還無法自然消除(除非手動呼叫 ZooKeeper 刪除節點方法)。

總結

由於 Dubbo 2.7.2 暫未釋出,所以建議若想使用 Dubbo 2.7 新功能的同學,使用 2.7.0 版本。若現在正在使用 2.7.2 版本,也不要慌張。只要服務不是異常當機或者使用 kill -9 強制殺死程式,以上的現象將不會碰到。正常服務關閉的時候,Dubbo 服務會主動去 ZooKeeper 登出該服務,並刪除這個節點。

還未使用該版本的同學們,建議使用 2.7.0 或者等 2.7.2 釋出以後,再使用。

Dubbo 2.7.1 踩坑記