【面試普通人VS高手】Kafka的零拷貝原理?

跟著Mic學架構發表於2022-04-09

原文網址 : https://www.cnblogs.com/mic112/p/16121839.html

面試Kafka

最近一個學員去滴滴面試，在第二面的時候遇到了這個問題：
"請你簡單說一下Kafka的零拷貝原理"
然後那個學員努力在大腦裡檢索了很久，沒有回答上來。
那麼今天，我們基於這個問題來看看，普通人和高手是如何回答的！

普通人的回答：

零拷貝是一種減少資料拷貝的機制，能夠有效提升資料的效率

高手的回答：

在實際應用中，如果我們需要把磁碟中的某個檔案內容傳送到遠端伺服器上，如圖

preview

那麼它必須要經過幾個拷貝的過程:

從磁碟中讀取目標檔案內容拷貝到核心緩衝區
CPU控制器再把核心緩衝區的資料賦值到使用者空間的緩衝區中
接著在應用程式中，呼叫write()方法，把使用者空間緩衝區中的資料拷貝到核心下的Socket Buffer中。
最後，把在核心模式下的SocketBuffer中的資料賦值到網路卡緩衝區（NIC Buffer)
網路卡緩衝區再把資料傳輸到目標伺服器上。

在這個過程中我們可以發現，資料從磁碟到最終傳送出去，要經歷4次拷貝，而在這四次拷貝過程中，有兩次拷貝是浪費的，分別是：

從核心空間賦值到使用者空間
從使用者空間再次複製到核心空間

除此之外，由於使用者空間和核心空間的切換會帶來CPU的上線文切換，對於CPU效能也會造成效能影響。

而零拷貝，就是把這兩次多於的拷貝省略掉，應用程式可以直接把磁碟中的資料從核心中直接傳輸給Socket，而不需要再經過應用程式所在的使用者空間，如下圖所示。

preview

零拷貝通過DMA（Direct Memory Access）技術把檔案內容複製到核心空間中的Read Buffer。

接著把包含資料位置和長度資訊的檔案描述符載入到Socket Buffer中，DMA引擎直接可以把資料從核心空間中傳遞給網路卡裝置。

在這個流程中，資料只經歷了兩次拷貝就傳送到了網路卡中，並且減少了2次cpu的上下文切換，對於效率有非常大的提高。

所以，所謂零拷貝，並不是完全沒有資料賦值，只是相對於使用者空間來說，不再需要進行資料拷貝。對於前面說的整個流程來說，零拷貝只是減少了不必要的拷貝次數而已。

在程式中如何實現零拷貝呢？

在Linux中，零拷貝技術依賴於底層的sendfile()方法實現
在Java中，FileChannal.transferTo() 方法的底層實現就是 sendfile() 方法。

除此之外，還有一個 mmap 的檔案對映機制

它的原理是：將磁碟檔案對映到記憶體, 使用者通過修改記憶體就能修改磁碟檔案。使用這種方式可以獲取很大的I/O提升，省去了使用者空間到核心空間複製的開銷。

以上就是我對於Kafka中零拷貝原理的理解

總結

本期的普通人VS高手面試系列就到這裡結束了。

本次的面試題涉及到一些計算機底層的原理，基本上也是業務程式設計師的知識盲區。

但我想提醒大家，做開發其實和建房子一樣，要想樓層更高更穩，首先地基要打牢固。

另外，如果你有任何面試相關的疑問，歡迎評論區給我留言。

我是Mic，一個工作了14年的Java程式設計師，我們們下篇文章再見。

零拷貝原理
2018-12-20
【面試普通人VS高手系列】Spring Boot中自動裝配機制的原理
2022-04-25
面試Spring Boot
【面試普通人VS高手系列】lock和synchronized區別
2022-04-14
面試synchronized
【面試普通人VS高手】Spring 中Bean的作用域有哪些？
2022-05-17
面試SpringBean
【面試普通人VS高手系列】談談你對Seata的理解
2022-04-07
面試
【面試普通人VS高手系列】innoDB如何解決幻讀
2022-04-11
面試
【面試普通人VS高手系列】b樹和b+樹的理解
2022-04-20
面試
【面試普通人VS高手系列】為什麼要使用Spring 框架？
2022-05-13
面試Spring框架
javascript 淺拷貝VS深拷貝
2018-08-11
JavaScript
【面試普通人VS高手系列】死鎖的發生原因和怎麼避免
2022-04-26
面試
【面試普通人VS高手系列】volatile關鍵字有什麼用？它的實現原理是什麼？
2022-04-29
面試
【面試普通人VS高手系列】能談一下CAS機制嗎？
2022-04-21
面試
【面試普通人VS高手系列】ConcurrentHashMap 底層具體實現知道嗎？實現原理是什麼？
2022-04-19
面試HashMap
【面試普通人VS高手系列】HashMap是怎麼解決雜湊衝突的？
2022-04-15
面試HashMap
【面試普通人VS高手系列】Dubbo是如何動態感知服務下線的？
2022-05-16
面試
【面試普通人VS高手系列】什麼叫做阻塞佇列的有界和無界
2022-04-16
面試佇列
【面試普通人VS高手系列】說一說Mybatis裡面的快取機制
2022-05-09
面試MyBatis快取
【面試普通人VS高手系列】Dubbo的服務請求失敗怎麼處理？
2022-04-18
面試
【面試普通人VS高手系列】CPU飆高系統反應慢怎麼排查？
2022-04-12
面試
Java零拷貝一步曲——Linux 中的零拷貝技術
2018-12-20
JavaLinux
【面試普通人VS高手系列】Spring Boot的約定優於配置，你的理解是什麼？
2022-04-08
面試Spring Boot
Java NIO - 零拷貝
2020-06-16
Java
從rocketmq入手，解析各種零拷貝的jvm層原理
2022-05-14
MQJVM
【面試普通人VS高手系列】說說快取雪崩和快取穿透的理解，以及如何避免？
2022-05-05
面試快取穿透
Linux 和 Java 的零拷貝
2020-06-16
LinuxJava
MySQL的零拷貝技術
2022-05-15
MySql
【面試普通人VS高手系列】Redis和Mysql如何保證資料一致性
2022-04-24
面試RedisMySql
如此淺顯易懂的零拷貝
2020-12-11
瞭解一下js物件深拷貝與淺拷貝(前端開發面試)
2020-10-16
JS物件前端面試
面試題 | 請實現一個深拷貝
2020-03-01
面試題
深入剖析Linux IO原理和幾種零拷貝機制的實現
2019-09-20
Linux
【面試普通人VS高手系列】請說一下你對分散式鎖的理解，以及分散式鎖的實現
2022-04-27
面試分散式
你以為面試官在問深拷貝的時候，僅僅是在問深拷貝嗎？
2020-07-29
面試
Netty（二）—— NIO 零拷貝機制
2020-11-10
Netty
深入理解零拷貝技術
2021-09-06
淺拷貝&深拷貝
2018-10-17
[Linux]Linux中的零拷貝技術（一）
2019-03-07
Linux
js的深拷貝和淺拷貝
2018-12-28
JS

【面試普通人VS高手】Kafka的零拷貝原理?

相關文章