RocketMQ部分資料消費不了問題排查

匠心零度發表於2019-03-01
RocketMQ部分資料消費不了問題排查

問題現象

今天忽然收到RocketMQ預警資訊如下:

RocketMQ部分資料消費不了問題排查

提醒有部分資料沒有消費,產生堆積情況。

開啟RocketMq-Console-Ng檢視如下圖形式:

RocketMQ部分資料消費不了問題排查

備註:第一反應是Consumer Group內訂閱了多個topic?(為什麼這麼懷疑,下次分析)。

通過命令statsAll 作用是查詢Topic and Consumer tps stats

sh mqadmin statsAll -n namesrv

發現沒有問題,很奇怪?還好之前原始碼看過,只能除錯原始碼了。

原始碼除錯

本篇不重點講解原始碼過程,後續有空再慢慢分析原始碼部分,消費端為了實現負載均衡器,每次當有結點新增或者減少都會重新doRebalance,預設選擇的就是獲取所有佇列以及得到對應group下面所有的cidAll(所有的消費端),之後類似於分頁操作差不多……

進行斷點到該位置發現奇怪現象:

RocketMQ部分資料消費不了問題排查

看到這裡就明白了為什麼RocketMq-Console-Ng檢視下面很多是空白的沒有消費端了,由於cidAll的0、2、3一樣一共有16個佇列,cidAll顯示4個 那麼每個客戶端應該是分配4個的,但是由於0、2、3都一樣 就分配一次的。

原始碼部分:

RocketMQ部分資料消費不了問題排查

備註: 現象是什麼大概清楚了,下面的重點是為什麼會出現這樣的情況呢?

問題排查

通過RocketMQ命令查詢結果還是一樣:

RocketMQ部分資料消費不了問題排查

看到這裡讓我不禁懷疑是否消費例項啟動多次,檢視程式碼依然沒有,實在沒辦法偶然檢視了下tomcat的配置,驚喜的發現:

RocketMQ部分資料消費不了問題排查

與該使用方交流發現是的確是沒有重啟部署了,重啟問題解決。

待解決

回頭看看為什麼會這樣,RocketMQ很多流程有點忘記了,抽空再過一遍,把這個問題梳理下。

天僅僅只是開始,期待你的持續關注,讓我們一起走進rocketmq的世界!!!

往期rocketmq系列文章


如果讀完覺得有收穫的話,歡迎點贊、關注、加公眾號【匠心零度】,查閱更多精彩歷史!!!

加入知識星球,一起探討!

RocketMQ部分資料消費不了問題排查

相關文章