Kafka高效能揭祕：sequence IO、PageCache、SendFile的應用詳解

大資料學習與分享發表於2020-11-20

原文網址 : https://www.cnblogs.com/bigdatalearnshare/p/13978681.html

大家都知道Kafka是將資料儲存於磁碟的，而磁碟讀寫效能往往很差，但Kafka官方測試其資料讀寫速率能達到600M/s，那麼為什麼Kafka效能會這麼高呢？

首先producer往broker傳送訊息時，採用batch的方式即批量而非一條一條的傳送，這種方式可以有效降低網路IO的請求次數，提升效能。此外這些批次訊息會"暫存"在緩衝池中，避免頻繁的GC問題。批量傳送的訊息可以進行壓縮並且傳輸的時候可以進行高效的序列化，從而減少資料大小。

Kafka除了在producer傳送訊息方面做了很多優化，還有很多其他的優化，比如Kafka利用了sequence IO、PageCache、SendFile這3種處理方案：

sequence IO

首先來了解一下磁碟的特性：快速順序讀寫、慢速隨機讀寫。因為磁碟是典型的IO塊裝置，每次讀寫都會經歷定址，其中定址中尋道是比較耗時的。隨機讀寫會導致定址時間延長，從而影響磁碟的讀寫速度。

大家有沒有想過MapReduce進行shuffle的時候，為什麼map端和reduce端要進行排序，不排序不也不影響正常業務的處理，排序反而因為消耗資源增加了處理時間？

以map端為例，執行過程中會產生很多小檔案，這些小檔案要經歷歸併排序等一系列處理後才會被reduce端進行處理。提前對未合併的檔案進行排序正是利用了磁碟快速順序讀寫的特性來提高歸併排序的速度。

而Kafka在將資料持久化到磁碟時，採用只追加的順序寫，有效降低了定址時間，提高效率。下圖展示了Kafka寫入資料到partition的方式：

可以看到Kafka會將資料插入到檔案末尾，並且Kafka不會"直接"刪除資料，而是把所有資料儲存到磁碟，每個consumer會指定一個offset來記錄自己訂閱的topic的partition中消費的位置。當然我們可以設定策略來清理資料，比如通過引數log.retention.hours指定過期時間，當達到過期時間時，Kafka會清理資料。

PageCache

PageCache是系統級別的快取，它把儘可能多的空閒記憶體當作磁碟快取使用來進一步提高IO效率，同時當其他程式申請記憶體，回收PageCache的代價也很小。

當上層有寫操作時，作業系統只是將資料寫入PageCache，同時標記Page屬性為Dirty。當讀操作發生時，先從PageCache中查詢，如果發生缺頁才進行磁碟排程，最終返回需要的資料。

PageCache同時可以避免在JVM內部快取資料，避免不必要的GC、以及記憶體空間佔用。對於In-Process Cache，如果Kafka重啟，它會失效，而作業系統管理的PageCache依然可以繼續使用。

對應到Kafka生產和消費訊息中：

producer把訊息發到broker後，資料並不是直接落入磁碟的，而是先進入PageCache。PageCache中的資料會被核心中的處理執行緒採用同步或非同步的方式寫回到磁碟。

Consumer消費訊息時，會先從PageCache獲取訊息，獲取不到才回去磁碟讀取，並且會預讀出一些相鄰的塊放入PageCache，以方便下一次讀取

如果Kafka producer的生產速率與consumer的消費速率相差不大，那麼幾乎只靠對broker PageCache的讀寫就能完成整個生產和消費過程，磁碟訪問非常少。

SendFile

傳統的網路I/O過程：

1. 作業系統從磁碟把資料讀到核心區

2. 使用者程式把資料從核心區copy到使用者區

3. 然後使用者程式再把資料寫入到socket，資料流入核心區的Socket Buffer上

4. 最後把資料從socket Buffer中傳送到到網路卡，這樣完成一次傳送

可以發現，同一份資料在核心Buffer與使用者Buffer之間拷貝兩次：

但是通過SendFile（又稱zero copy）優化後，直接把資料從核心區copy到socket，然後傳送到網路卡，避免了在核心Buffer與使用者Buffer來回拷貝的弊端：

不僅是Kafka，Java的NIO提供的FileChannle，它的transferTo、transferFrom方法也利用了這種在核心區完成資料傳輸的功能。

關注微信公眾號：大資料學習與分享，獲取更對技術乾貨

閆燕飛：Kafka的高效能揭祕及優化
2018-05-03
Kafka優化
VMware的雲原生應用技術揭祕
2020-04-04
詳解數倉中sequence的應用場景及最佳化
2023-03-09
詳解數倉物件設計中序列SEQUENCE原理與應用
2024-04-02
物件
IO多路複用詳解
2021-08-04
揭開單體應用程式的神祕面紗
2022-06-08
IO多路複用機制詳解
2021-05-27
應用加密1；非對稱加密演算法揭祕
2018-11-02
加密演算法
「Kafka應用」名詞概念解釋
2021-01-03
Kafka
CSS揭祕實用技巧總結
2020-04-07
CSS
詳解Kafka Producer
2019-11-15
Kafka
揭祕ThreadLocal
2019-03-04
thread
揭祕instancetype
2018-04-19
「揭祕GP」Greenplum 的人工智慧應用場景：MADlib、GPText、GPU
2019-09-18
人工智慧GPTGPU
高效能Kafka
2022-02-08
Kafka
揭祕 YYModel 的魔法（下）
2019-03-04
Kafka核心元件詳解
2022-04-30
Kafka元件
揭祕蘋果應用商店評級：真是使用者說了算的移動應用“命脈”嗎？
2020-09-09
蘋果
揭祕RedisGraph: Redis內嵌高效能記憶體圖資料庫
2019-03-04
Redis記憶體資料庫
揭祕JavaScript中“神祕”的this關鍵字
2019-03-05
JavaScript
RAC環境下的SEQUENCE對應用的影響
2019-01-26
socket.io 原理詳解
2019-04-06
engine.io 原理詳解
2019-01-26
System.IO.Pipelines: .NET高效能IO
2018-07-10
Istio的複雜性揭祕
2021-10-15
kafka核心架構詳解
2020-11-14
Kafka架構
Kafka實戰寶典：Kafka的控制器controller詳解
2020-09-21
KafkaController
揭祕前端儲存
2019-04-09
前端
ReactJS底層揭祕
2018-06-04
ReactJS
synchronized底層揭祕
2020-11-30
synchronized
kafka的原理及叢集部署詳解
2023-03-18
Kafka
asyncio非同步IO——Streams詳解
2018-11-30
非同步
Android PathMeasure詳解和應用
2019-02-09
Android
在 CentOS 下為 nginx 啟用 SSL_sendfile 支援
2021-12-27
CentOSNginx
[譯]Python的enumerate()函式揭祕
2019-03-01
Python函式
揭祕js框架中的常用套路
2018-08-10
JS框架
View.Post () 的身世大揭祕
2018-08-01
View
揭開 Kubernetes 的神祕面紗
2019-11-30

Kafka高效能揭祕：sequence IO、PageCache、SendFile的應用詳解

相關文章