Kafka基礎認識

Fingertip_beat發表於2018-05-03

原文網址 : https://flycode.co/archives/248191

1）：Apache kafka介紹及架構詳解

假設一個場景：
    資料來源：
        應用系統A 產生的使用者訪問資料和訂單資料
                10000 條一秒鐘
                    push：推送資料
                訊息系統：佇列 產生的資料量>資料量
                    pusll：拉取資料

訊息系統kafka：
        分散式系統佇列系統
        分佈/訂閱功能
        不恰當比喻：   
                    釋出者來發布文章 -> 推送文章
                微信公眾號：    類似於  -Topic主題/類別
                    訂閱者1
                    訂閱則2
                    訂閱則3
                    訂閱則4
                    ...訂閱者 就能接受到這篇文章訊息



kafka的功能：
    -1：分散式訊息Message系統（釋出/訂閱功能）
        0.8.x功能

    -2：Connector API
        將Kafka Topics中的資料儲存到RDBMS資料庫中
        0.9.x

    -3：Stream Compute
        可以對Kafka中的資料進行流實計算功能
        0.10.x


SparkStreaming與kafka整合，使用的版本為0.8.2.x

kafka系統能夠通過分散式提交日誌處理資料，kafka中topics使用者
定於的一個類別


Kafka Cluster：
    - 訊息系統，儲存資料
        提交日誌格式檔案
    - 分散式：
        有多臺資料，進行儲存資料
    - Topic 
        儲存某一類的資料（訊息），類比於微信公眾號
        儲存資料類似於HDFS
         -i，按照分割槽partition儲存
             相當於資料夾下面有很多檔案
        -ii，分割槽資料有多個副本
             replications（每個資料有3個副本）
    - 分佈/訂閱
        消費者（使用者）可以訂閱Topic（類比於關注某個微信公眾號）
        只要生產者向Topic傳送資料，訂閱者就可以自動接受到資料
        進行處理

一個典型的Kafka叢集中包含若干個Producer，（Kafka支援水平擴充套件，一般Broker
數量越多，叢集吞吐率越高），若干個Consumer Group，以及一個Zookeeper叢集

Kafka通過Zookeeper管理叢集配置，選舉leader，以及在Consumer Group發生變化
時進行reablance。

Producer使用push模式將訊息釋出到broker，Consumer使用pull模式從broker訂閱
並消費訊息

TOPIC & PARTITION

一個Topic分為多個Partition來進行資料管理
一個Partition中的資料是有序，不可變的
使用偏移量（offset）唯一標識一條資料，是
一個long型別的資料；

Partiton接受到producer傳送過來資料後，會
產生一個遞增的offset偏移量資料，同是將數
據儲存到本地的磁碟檔案中（檔案內容追加
的方式寫入資料）

    基本懂得Kafka流程，搭建起來很簡單

Kafka 基礎知識
2024-06-09
Kafka
kafka基礎知識梳理
2021-06-22
Kafka
kafka初認識（一）
2021-10-18
Kafka
JS 中物件基礎認識
2022-05-02
JS物件
伺服器的基礎認識
2019-11-14
伺服器
Redis日常運維-基礎認識
2020-07-11
Redis運維
strcat函式的基礎認識
2020-12-30
函式
Kafka訊息系統基礎知識索引
2018-12-18
Kafka索引
Java基礎系列-SPI你認識嗎
2020-10-13
Java
linux 基礎（6）簡單認識 bash
2023-02-08
Linux
kafka基礎原理
2022-05-06
Kafka
寫給小白的音訊認識基礎
2019-03-04
音訊
java基礎之執行緒認識volatile
2019-03-14
Java執行緒
一，認識計算機和Java基礎
2024-10-20
計算機Java
DevOps基礎的認識與工具實踐
2021-08-10
dev
資料分析基礎—3.1 認識資料
2021-09-09
2020年12月-前端基礎-認識WEB
2020-12-24
前端Web
kafka的認識、安裝與配置
2020-07-08
Kafka
kafka及redis基礎
2020-09-27
KafkaRedis
kafka基礎學習
2024-10-11
Kafka
Kafka基礎入門
2021-09-21
Kafka
java基礎之執行緒認識原子類
2019-03-16
Java執行緒
Kafka基礎入門篇
2021-10-09
Kafka
kafka 基礎知識梳理及叢集環境部署記錄
2018-05-10
Kafka
Kafka原理分析之基礎篇
2021-05-04
Kafka
阿里讓你更清楚的認識自己的Python基礎
2019-07-04
阿里Python
阿里讓你更清楚的認識自己的Java基礎
2019-07-04
阿里Java
java基礎之執行緒認識一下synchronize
2019-03-14
Java執行緒
Final Cut Pro中文新手教程 (1) 基礎認識Final Cut Pro
2021-10-14
【人生苦短，我學 Python】基礎篇——初步認識（Day1）
2020-12-08
Python
基礎知識
2018-03-29
帶你漲姿勢的認識一下 Kafka
2019-10-17
Kafka
Coinbase如何改造基礎設施中Kafka？
2022-11-21
Kafka
CSS 基礎知識初識
2018-10-10
CSS
Go 基礎教程--2-基礎知識
2019-09-16
Go
Web測試基礎-Html基礎知識
2019-04-29
WebHTML
WiFi基礎(六)：天線基礎知識
2024-10-14
WiFi
Envoy基礎知識
2018-10-29

Kafka基礎認識

1）：Apache kafka介紹及架構詳解

TOPIC & PARTITION

相關文章