一招讓Kafka達到最佳吞吐量

kevwan發表於2021-03-17

原文網址 : https://learnku.com/articles/55352

通過上一篇文章對 dq 生產者的分析，我們知道 dq 是基於 beanstalk 的封裝。至於 生產者 我們在後續的文章繼續分享，本篇文章先來分析一下 go-queue 中的 kq。

kq 基於 kafka 封裝，設計之初是為了使 kafka 的使用更人性化。那就來看看 kq 的使用。

上手使用

func main() {
  // 1. 初始化
    pusher := kq.NewPusher([]string{
        "127.0.0.1:19092",
        "127.0.0.1:19092",
        "127.0.0.1:19092",
    }, "kq")

    ticker := time.NewTicker(time.Millisecond)
    for round := 0; round < 3; round++ {
        select {
        case <-ticker.C:
            count := rand.Intn(100)
            m := message{
                Key:     strconv.FormatInt(time.Now().UnixNano(), 10),
                Value:   fmt.Sprintf("%d,%d", round, count),
                Payload: fmt.Sprintf("%d,%d", round, count),
            }
            body, err := json.Marshal(m)
            if err != nil {
                log.Fatal(err)
            }

            fmt.Println(string(body))
      // 2. 寫入
            if err := pusher.Push(string(body)); err != nil {
                log.Fatal(err)
            }
        }
    }
}

將 kafka cluster 配置以及 topic 傳入，你就得到一個操作 kafka 的 push operator。

至於寫入訊息，簡單的呼叫 pusher.Push(msg) 就行。是的，就這麼簡單！

當然，目前只支援單個 msg 寫入。可能有人會疑惑，那就繼續往下看，為什麼只能一條一條寫入？

初始化

一起看看 pusher 初始化哪些步驟：

NewPusher(clusterAddrs, topic, opts...)
    |- kafka.NewWriter(kfConfig)                                // 與 kf 之前的連線
    |- executor = executors.NewChunkExecutor()  // 設定內部寫入的executor為位元組數定量寫入

建立與 kafka cluster 的連線。此處肯定就要傳入 kafka config；
設定內部暫存區的寫入函式以及重新整理規則。

使用 chunkExecutor 作用不言而喻：將隨機寫 -> 批量寫，減少 I/O 消耗；同時保證單次寫入不能超過預設的 1M 或者自己設定的最大寫入位元組數。

其實再往 chunkExecutor 內部看，其實每次觸發插入有兩個指標：

maxChunkSize：單次最大寫入位元組數
flushInterval：重新整理暫存訊息插入的間隔時間

在觸發寫入，只要滿足任意一個指標都會執行寫入。同時在 executors 都有設定插入間隔時間，以防暫存區寫入阻塞而暫存區內訊息一直不被重新整理清空。

更多關於 executors 可以參看以下：zeromicro.github.io/go-zero/execut...

生產者插入

根據上述初始化對 executors 介紹，插入過程中也少不了它的配合：

func (p *Pusher) Push(v string) error {
  // 1. 將 msg -> kafka 內部的 Message
    msg := kafka.Message{
        Key:   []byte(strconv.FormatInt(time.Now().UnixNano(), 10)),
        Value: []byte(v),
    }

  // 使用 executor.Add() 插入內部的 container
  // 當 executor 初始化失敗或者是內部發生錯誤，也會將 Message 直接插入 kafka
    if p.executor != nil {
        return p.executor.Add(msg, len(v))
    } else {
        return p.produer.WriteMessages(context.Background(), msg)
    }
}

過程其實很簡單。那 executors.Add(msg, len(msg)) 是怎麼把 msg 插入到 kafka 呢？

插入的邏輯其實在初始化中就宣告瞭：

pusher.executor = executors.NewChunkExecutor(func(tasks []interface{}) {
        chunk := make([]kafka.Message, len(tasks))
      // 1
        for i := range tasks {
            chunk[i] = tasks[i].(kafka.Message)
        }
      // 2
        if err := pusher.produer.WriteMessages(context.Background(), chunk...); err != nil {
            logx.Error(err)
        }
    }, newOptions(opts)...)

觸發插入時，將暫存區中儲存的 []msg 依次拿出，作為最終插入訊息集合；
將上一步的訊息集合，作為一個批次插入 kafka 的 topic 中

這樣 pusher -> chunkExecutor -> kafka 一個鏈路就出現了。下面用一張圖形象表達一下：

框架地址

github.com/tal-tech/go-queue

同時在 go-queue 也大量使用 go-zero 的批量處理工具庫 executors。

github.com/tal-tech/go-zero

歡迎使用 go-zero & go-queue 並 star 支援我們！一起構建 go-zero 生態！?

本作品採用《CC 協議》，轉載必須註明作者和本文連結

github.com/tal-tech/go-zero

如何讓訊息佇列達到最大吞吐量？
2021-05-12
佇列
如何讓ThinkPHP的模板引擎達到最佳效率
2019-05-11
PHP
伯克利開源 Confluo：吞吐量比 Kafka 高 4 到 10 倍
2018-12-14
Kafka
高吞吐量訊息系統—kafka
2020-08-12
Kafka
kafka高吞吐量之訊息壓縮
2020-04-24
Kafka
最佳實踐｜從Producer 到 Consumer，如何有效監控 Kafka
2022-05-27
Kafka
[訊息佇列]kafka高效能/高吞吐量
2024-10-03
佇列Kafka
Kafka最佳實踐
2023-03-13
Kafka
一招，讓停車管理不再難
2022-07-12
kafka生產者和消費者吞吐量測試-kafka 商業環境實戰
2018-10-28
Kafka
Flume 整合 Kafka_flume 到kafka 配置【轉】
2024-04-15
Kafka
Apache Kafka 12個最佳實踐
2022-11-27
ApacheKafka
如何讓HTTPS站點評級達到A+? 還得看這篇HTTPS安全優化配置最佳實踐指南
2022-04-10
HTTP優化
kafka 安裝到使用
2020-06-10
Kafka
kafka叢集基於吞吐量指標進行效能調優實踐-kafka 商業環境實戰
2018-12-03
Kafka指標
Kafka從入門到放棄(一) —— 初識Kafka
2021-12-02
Kafka
kafka快速入門到精通
2022-04-05
Kafka
Apache Kafka最佳化部署的十大最佳實踐
2018-10-21
ApacheKafka
怎麼樣讓智慧經營推廣達到好的效果
2021-04-13
吞吐量
2018-03-23
面對流量洪峰，Kafka如何保證資料安全和系統的高吞吐量？
2020-02-27
Kafka
Apache Kafka零複製最佳化原理
2024-07-04
ApacheKafka
kafka從入門到關門
2020-10-31
Kafka
Kafka - 配置檔案引數最佳化方案
2023-05-17
Kafka
springboot+kafka+郵件傳送（最佳實踐）
2019-08-01
Spring BootKafka
教你三招從讓效能從20s最佳化到500ms
2022-07-20
getScrollHeight到達底部
2018-11-26
[譯]從LinkedIn，Apache Kafka到Unix哲學
2019-05-11
ApacheKafka
這一招可以讓pdf整篇自動翻譯，pdf翻譯的方法分享
2019-08-12
React最佳實踐？看看Facebook員工寫的這本書能讓你學到什麼？
2018-09-18
React
達達快送小程式效能最佳化實踐
2023-01-19
分散式、高吞吐量、高可擴充套件性訊息佇列服務Kafka商業化釋出！
2018-07-31
分散式套件佇列Kafka
PostgreSQL邏輯複製資料同步到kafka
2022-03-31
SQLKafka
Kafka資料每5分鐘同步到Hive
2020-12-26
KafkaHive
角色設計沒靈感怎麼辦？這一招讓你思如泉湧
2020-05-08
使用Scala開發Apache Kafka的TOP 20大最佳實踐！
2018-08-23
ApacheKafka
Apache Kafka在大型應用中的20項最佳實踐
2018-08-30
ApacheKafka
模擬測試生成Apache Kafka負載的最佳工具：KLoadGen
2021-06-22
ApacheKafka負載

一招讓Kafka達到最佳吞吐量

上手使用

初始化

生產者插入

框架地址

相關文章