【kafka學習筆記】kafka的基本概念

快樂的提千萬發表於2021-12-12

在瞭解了背景知識後，我們來整體看一下kafka的基本概念，這裡不做深入講解，只是初步瞭解一下。

kafka的訊息架構

注意這裡不是設計的架構，只是為了方便理解，腦補的三層架構。從程式碼的實現來看，kafka其實就一層，不像MySQL分了服務層、引擎層之類的。

主題層

首先是主題層，Topic（主題），比如使用者訊息，命名為'user_message';支付訊息，命名為'pay_message'。兩者互不干擾，等於是兩條道。

注意這裡的Topic是邏輯概念，落到硬體上，應該叫partition（分割槽），為了提升吞吐量，kafka將一個主題分成了多個區，就像MongoDB 和 Elasticsearch 中的 Sharding、HBase 中的 Region，這是分散式的前提。

值得注意的是，kafka只保證單個partition上的順序。談到順序，我們瞭解一下offest，它標記了消費者在這個partiotion上讀到了哪一條。

那麼我們想要順序消費，也要提升消費速度，怎麼辦？

如果兩個消費者同時消費同一個topic下的同一個partition，很顯然，他們會重複消費。因為每個消費者的offest是獨立儲存的。
如果我們分成兩個partition，假設topic的資料是123456，採用隨機分配的策略，partition1上的可能是135,2上面是246,消費者A讀取1，B讀取2，這樣就不會重複消費了，但是如果A的速度很快，可能A都到5了，B的2還沒讀完。這就導致了亂序消費。
很簡單，在上面的方案中，我們將隨機分配改成雜湊分配，從業務層將一個業務邏輯的訊息傳送到同一個partition上，比如使用者ID。如果你的運氣足夠不好，可能會出現一個partition訊息多，另一個少的情況。

好了，回顧下， topic，partition，offest。

分割槽層

在實際應用中，我們往往將partition分配在不同的磁碟上，利用多磁碟來增加讀寫效率。但是既然是分散式，必然需要多個機器，而一個機器，我們常常稱為一個broker（節點）。

多節點不一定要再不同的機器上，只是我們之所以需要多節點就是為了防止意外當機，如果都在同一臺上，一死就全死了，毫無意義。

每個broker都有一套冗餘資料，也叫做 repliaction（副本）。（天天網遊裡面下副本，今天終於知道副本是啥了吧。其實網遊之所以有副本，就是為了防止玩家都湧入一個機器，在大家進入副本的時候，就切換到一個新的機器上了，和其他副本互不干擾。）

那麼如果我們有三個節點，客戶端怎麼知道需要連線哪個呢？這就引入了兩個概念，leader（領導者），follower(跟隨者)。對了，還有個管家，叫zookeeper，它負責管理所有broker的IP地址，是否存活，然後怎麼選取領導者，怎麼換領導者。這中間的演算法，我們後面再細細講。

總之，zookeeper會選取leader，然後生產者和消費者只和leader互動。那麼follower做啥？就是跟著跑，把leader的訊息不斷拉到本地，準備有一天等領導掛了自己成為新的領導。

（這裡和MySQL不一樣，MySQL的從庫還負責給客戶端讀。）

好了，回顧下， broker，replication，leader，follower。

訊息層

這一層主要是儲存資訊和消費者的offest。值得注意的是，訊息是可以壓縮的，上一篇也提到了，這樣可以大大減少網路頻寬。但是具體細節後面再說。

總結

kafka的陌生詞彙還是挺多的，自己在腦海中多過兩遍，總整體，到部分，有個基本概念就好，後面談到的時候能更好地理解。

Kafka 學習筆記（二）：初探 Kafka
2019-03-04
Kafka筆記
Kafka學習筆記（二）：初探Kafka
2018-03-26
Kafka筆記
Kafka 學習筆記
2022-02-07
Kafka筆記
kafka學習筆記（一）
2020-11-23
Kafka筆記
Kafka學習筆記（一）：為什麼需要Kafka？
2018-03-25
Kafka筆記
Kafka 學習筆記（一）：為什麼需要 Kafka？
2018-03-14
Kafka筆記
kafka官方文件學習筆記2–QuickStart
2018-01-17
Kafka筆記UI
史上最全、最詳細的 kafka 學習筆記！
2018-11-27
Kafka筆記
kafka 筆記
2019-01-09
Kafka筆記
《Kafka筆記》1、Kafka初識
2020-10-18
Kafka筆記
Kafka基本概念
2020-12-13
Kafka
Kafka 基本概念
2017-05-07
Kafka
訊息中介軟體-kafka學習筆記一
2020-11-02
Kafka筆記
kafka學習筆記1:測試環境搭建
2017-09-24
Kafka筆記
《Kafka筆記》3、Kafka高階API
2020-10-20
Kafka筆記API
Kafka學習
2019-04-24
Kafka
Apache Kafka 的基本概念
2023-01-09
ApacheKafka
Kafka學習（四）-------- Kafka核心之Producer
2019-08-06
Kafka
kafka學習（二）-------- 什麼是Kafka
2019-07-22
Kafka
Kafka學習之（四）PHP操作Kafka
2018-01-17
KafkaPHP
筆記：初識Kafka
2018-09-30
筆記Kafka
Kafka學習（三）-------- Kafka核心之Cosumer
2019-07-25
Kafka
Kafka學習之（六）搭建kafka叢集
2018-02-15
Kafka
Kafka超詳細學習筆記【概念理解，安裝配置】
2020-12-26
Kafka筆記
《Kafka筆記》4、Kafka架構，與其他元件整合
2020-10-21
Kafka筆記架構元件
Kafka學習之（七）搭建kafka視覺化服務Kafka Eagle
2018-02-18
Kafka視覺化
Kafka學習之（二）Centos下安裝Kafka
2018-01-16
KafkaCentOS
Kubernetes 學習筆記-- kafka往couchdb裡倒東西
2021-04-19
筆記Kafka
Kafka 總結學習
2021-06-26
Kafka
kafka初裝學習
2016-12-09
Kafka
oracle基本概念的學習筆記(轉)
2007-08-11
Oracle筆記
Kafka文件閱讀筆記（一）
2015-10-29
Kafka筆記
Java實現Kafka讀寫筆記
2017-04-18
JavaKafka筆記
從零開始學習Kafka
2019-05-10
Kafka
Spring Kafka深入學習分析
2022-05-18
SpringKafka
HTTP2基本概念學習筆記
2018-04-10
HTTP筆記
Kafka學習之（五）搭建kafka叢集之Zookeeper叢集搭建
2018-02-14
Kafka
《Kafka筆記》2、環境搭建、Topic管理
2020-10-19
Kafka筆記

【kafka學習筆記】kafka的基本概念

kafka的訊息架構

主題層

分割槽層

訊息層

總結

相關文章