Apache Kafka內部刪除了對ZooKeeper的依賴

banq發表於2020-05-17

Apache Kafka使用Apache ZooKeeper儲存其後設資料，ZooKeeper有什麼問題呢？實際上，問題不在於ZooKeeper本身，而在於外部後設資料管理的概念。

有兩個系統會導致很多重複。畢竟，Kafka是複製的分散式日誌，其頂部是pub / sub API。ZooKeeper是一個複製的分散式日誌，頂部是檔案系統API。每個都有其自己的網路通訊，安全性，監視和配置方式。使用兩個系統會使維護人員的結果總複雜度大約翻倍。這導致不必要的陡峭學習曲線，並增加了某些配置錯誤導致安全漏洞的風險。

在外部儲存後設資料不是很有效。我們至少執行三個附加的Java程式，有時還要執行更多。實際上，我們經常看到Kafka叢集的ZooKeeper節點與Kafka節點一樣多！此外，ZooKeeper中的資料也需要反映在Kafka控制器上，這會導致雙重快取。

更糟糕的是，在外部儲存後設資料限制了Kafka的可伸縮性。當Kafka叢集啟動或選擇新的控制器時，控制器必須從ZooKeeper載入叢集的完整狀態。隨著後設資料量的增加，此載入過程的時間也隨之增加。這限制了Kafka可以儲存的分割槽數量。

最後，將後設資料儲存在外部會增加控制器的記憶體狀態與外部狀態不同步的可能性。控制器的活動檢視（位於群集中）也可以與ZooKeeper的檢視不同。

KIP-500
KIP-500概述了在Kafka中處理後設資料的更好方法。您可以將其稱為“ Kafka on Kafka”，因為它涉及將Kafka的後設資料儲存在Kafka本身中，而不是儲存在諸如ZooKeeper之類的外部系統中。
在後KIP-500時代，後設資料將儲存在Kafka內的分割槽中，而不是儲存在ZooKeeper中。控制器將成為該分割槽的負責人。僅Kafka本身就不會配置和管理外部後設資料系統。
我們將後設資料視為日誌。需要最新更新的代理只能讀取日誌的末尾。這類似於需要最新日誌條目的使用者僅需要讀取日誌的最後而不是整個日誌的方式。經紀人還將能夠在整個流程重啟期間保留其後設資料快取。

Kafka 入門（三）--為什麼 Kafka 依賴 ZooKeeper？
2020-07-28
Kafka
docker 刪除依賴的父映象的命令
2020-12-07
Docker
npm 安裝、刪除依賴命令
2018-06-29
NPM
Spring 對Apache Kafka的支援與整合
2020-11-26
SpringApacheKafka
Kafka——zookeeper的作用
2024-04-13
Kafka
Maven依賴管理：控制依賴的傳遞
2019-03-02
Maven
zookeeper、dubbo、kafka
2019-03-07
Kafka
在Idea 內搜尋新增Maven 依賴
2018-05-10
IdeaMaven
word內容被刪除怎麼辦？word內容被刪除了的恢復方法
2019-11-12
依賴管理和依賴範圍
2024-07-26
Apache Pulsar 與 Apache Kafka 在金融場景下的效能對比分析
2021-11-28
ApacheKafka
rimraf 命令強制刪除依賴庫檔案
2018-04-04
依賴
2024-09-12
領域驅動設計對依賴的控制
2022-06-10
關於我對Spring迴圈依賴的思考
2022-05-29
Spring
探索 JavaScript 中的依賴管理及迴圈依賴
2019-03-01
JavaScript
探索Kafka消費者的內部結構
2022-07-25
Kafka
kafka的內部實現、安裝和使用
2021-09-09
Kafka
Elasticsearch依賴與Spring對應關係
2019-10-28
ElasticsearchSpring
半導體“依賴症”：世界依賴中國、中國依賴世界
2020-11-12
[Apache][Nginx]構建僅對團隊內部公開使用的web應用
2021-11-06
ApacheNginxWeb
依賴注入？依賴注入是如何實現解耦的?
2020-05-15
依賴注入解耦
spring 的依賴注入
2021-01-03
Spring依賴注入
我對控制反轉以及依賴注入的認識
2018-06-18
依賴注入
對控制反轉和依賴注入的突然頓悟
2021-06-24
依賴注入
一個.NET內建依賴注入的小型強化版
2024-04-17
依賴注入
滴滴雲部署 ZooKeeper + Kafka
2019-01-21
Kafka
kafka和zookeeper安裝
2021-11-22
Kafka
解題報告-論對“依賴揹包”的新理解
2024-12-07
Apache Curator 操作Zookeeper api
2019-01-16
ApacheAPI
Apache Kafka 的基本概念
2023-01-09
ApacheKafka
cargo 中的版本依賴
2019-12-19
Cargo
nodejs 中的依賴管理
2019-01-29
NodeJS
Flutter 中的依賴管理
2021-03-24
Flutter
再探迴圈依賴 → Spring 是如何判定原型迴圈依賴和構造方法迴圈依賴的？
2021-03-15
Spring原型構造方法
Apache Kafka教程--Kafka新手入門
2023-03-14
ApacheKafka
依賴引入 | Android依賴引入史上最全攻略
2018-07-24
Android
Spring的依賴注入的方式
2020-11-19
Spring依賴注入

Apache Kafka內部刪除了對ZooKeeper的依賴

相關文章