kafka.network.SocketServer分析

devos發表於2014-06-10

當Kafka啟動時，會啟動這個SocketServer來接收客戶端的連線，處理客戶端請求，傳送響應。

這個類的註釋說明了這個socket server的結構

/**
* An NIO socket server. The threading model is
* 1 Acceptor thread that handles new connections
* N Processor threads that each have their own selector and read requests from sockets
* M Handler threads that handle requests and produce responses back to the processor threads for writing.
*/

即

1個Acceptor，用來接收新的連線。

N個Processor，每個Processor有自己的selector，Processor從sockets裡讀取請求，以及寫response到sockets。

M個Handler用來處理請求，並且產生response給Processor。

其中：

Acceptor監聽新連線，如果有新連線，就分配給某個Processor，這個Processor會把這個SocketChannel註冊給自己的Selector，註冊為OP_READ。當這個SocketChannel可讀，就從中讀資料，產生Request，然後放入到RequestChannel的佇列中。

Processor還會從新RequestChannel中不斷取Response，然後把Response對應的SocketChannel在自己的Selector上註冊為OP_WRITE，當這個SocketChannel可寫，就把資料寫入。然後把這個SocketChannel註冊為OP_READ，繼續監聽請求。

其中使用的類主要包括：

Acceptor : 它是一個SocketServer, 接受新的連線，並且分配連線給Processor

Processor: 讀取請求，傳送響應

Handler: 處理請求，產生響應。這裡的Handler由kafka.server.RequestHandler實現。

RequestChannel: 它包括了一個request queue 和一個 response queue. 是Handler和Processsor互動時使用的佇列。Request由Processor放入RequestChannel, 由Handler取出，然後把Response放回RequestChannel.

Acceptor在接受連線後，就把相當的SocketChannel設成非阻塞模式。因此Processor對這些SocketChannel的讀寫都是使用Selector，採用非阻塞的處理模式。

問題：

(1) Acceptor是如何把新來的連線分配給對應的Processor，這個演算法是什麼？是round robin嗎？

在每接收一個請求後，呼叫

// round robin to the next processor thread

currentProcessor = (currentProcessor + 1 ) % processors .length

而每個新的socketChannel分配的方式為：

accept(key, processors(currentProcessor ))

這個key就是Acceptor的Selector返回的SelectionKey

因此，socketChannel分配給Processor的過程是round robin的

(2) Processor應該把對應的SocketChannel在自己的Selector上如何註冊？

首先，Acceptor會把這個SocketChannel傳送給對應的Processor:

在收到一個新的連線時，Acceptor對它呼叫自己的accept方法

accept(key: SelectionKey, processor: Processor)

為了使用Selector,它會將新到的SocketChannel配置為非阻塞模式，然後配置sendBufferSize

然後呼叫Processor的accept方法。

然後，Processor會把這個SocketChannel加入到自己的newConnection佇列中。

在每個Processor內部有一個ConcurrentLinkedQueue

private val newConnections = new ConcurrentLinkedQueue [SocketChannel]()

然後Processor會處理這個新連線。

Processor的accept方法實現為：

newConnections.add(socketChannel)

wakeup()

即，將新的socketChannel加到佇列中，然後wakeup自己的selector。

這會使得select從阻塞狀態醒來，執行一次select()外層的while迴圈。在每次迴圈的開始，都會處理新的connection。

configureNewConnections()

這個方法的實現為：

while( newConnections.size() > 0 ) {

val channel = newConnections.poll()

channel.register( selector, SelectionKey. OP_READ)

}

這個socketChannel被註冊為OP_READ

於是，當這個連線有請求過來，Processor的Selector就會從select方法中返回，Processor開始讀取請求。

(3) Processor如何讀取請求？

首先，如果一個SocketChannel可讀。Processor在自己run方法的while迴圈中會從select方法中獲得對應的SelectionKey。

在Processor的run方法的while迴圈中：

if(key .isReadable)

read( key)

read方法會從SocketChannel中讀取並構造Request物件，然後把它傳送給RequestChannel。

　　　它的實現為：

  /*
   * Process reads from ready sockets
   */
  def read(key: SelectionKey) {
    val socketChannel = channelFor(key) //獲取可讀的SocketChannel
    var receive = key.attachment.asInstanceOf[Receive] //獲取attach到SelectionKey的Receive物件
    if(key.attachment == null) {  //如果attachment是空，說明這是第一次讀，就新建一個Receive物件，attach到這個SocketChannel的SelectionKey上。如果不是空，說明之前已經從中讀了一些資料，只是沒讀完。
      receive = new BoundedByteBufferReceive(maxRequestSize)
      key.attach(receive)
    }
    val read = receive.readFrom(socketChannel) //從SocketChannel中讀資料
    val address = socketChannel.socket.getRemoteSocketAddress();
    trace(read + " bytes read from " + address)
    if(read < 0) { //如果讀的資料數小於0，就關閉socket連線。實際上從BoundedByteBufferReceive的實現來看，read的值不會小於0
      close(key)
    } else if(receive.complete) {//如果讀完了，就構造request,傳送給requestChannel
      val req = RequestChannel.Request(processor = id, requestKey = key, buffer = receive.buffer, startTimeMs = time.milliseconds, remoteAddress = address)
      requestChannel.sendRequest(req)
      key.attach(null) //取消attach的Receive物件
      // explicitly reset interest ops to not READ, no need to wake up the selector just yet
      key.interestOps(key.interestOps & (~SelectionKey.OP_READ))//顯示地把這個SocketChannel設為非OP_READ，等到Response發給這個SocketChannel以後，它會被再設為OP_READ，以繼續處理來自這個SocketChannel的請求。
    } else {//如果沒有讀完，就把這個SocketChannel註冊為OP_READ，然後wakeup對應的selector，繼續從SocketChannel中讀資料。所以下一次再處理這個SocketChannel時，attach到它的SelectionKey的Receive物件就不是空了。
      // more reading to be done
      trace("Did not finish reading, registering for read again on connection " + socketChannel.socket.getRemoteSocketAddress())
      key.interestOps(SelectionKey.OP_READ)
      wakeup()
    }
  }

　　那麼BoundedByteBufferReceive是如何知道一個請求讀沒讀完呢？

　　原來每個Request的前4個位元組標識了這個Request有多長，BoundedByteBufferReceive從SocketChannel中讀取前4個位元組，轉換成整形，以這個整數為大小構造一個ByteBuffer，如果這個ByteBuffer沒有寫滿，就說明請求的內容還沒有讀完。receive.complete就不被設為true，否則就說明這個Request已經從channel中完全讀出。

      if(!contentBuffer.hasRemaining) {
        contentBuffer.rewind()
        complete = true
      }

在Kafka的Wire Format中有說明：

Request Header (all single non-multi requests begin with this)

0                   1                   2                   3

0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

|                       REQUEST_LENGTH                          |

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

|         REQUEST_TYPE          |        TOPIC_LENGTH           |

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

/                                                               /

/                    TOPIC (variable length)                    /

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

|                           PARTITION                           |

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

(4) Processor如何接收Handler產生的response?

它會在run方法的while迴圈中獲取RequestChannel中的Response，然後把它寫到SocketChannel。

中間的機制和Request類似。

後端分析/前端分析/邊緣分析
2020-08-19
後端前端
【漏洞分析】KaoyaSwap 安全事件分析
2022-08-28
事件
jemeter分析(二) — jmeter案例分析
2015-07-23
JMeter
USB 邏輯分析儀分析丟包怎麼分析（lecroy USB 邏輯分析儀）
2024-08-28
Giraph原始碼分析（六）——Edge 分析
2019-08-12
原始碼
從電影分析到遊戲分析
2021-04-02
遊戲
故障分析 | MySQL死鎖案例分析
2023-01-05
MySql
EOS原始碼分析(3)案例分析
2018-05-13
原始碼
MyCAT原始碼分析——分析環境部署
2018-05-16
原始碼
Excel做分析-相關性分析
2017-07-21
Excel
分析建模-如何識別分析類？
2015-10-04
分析：應用收費模式分析
2012-06-24
模式
分析建模中的行為分析
2015-10-07
apache kafka原始碼分析-Producer分析
2015-11-17
ApacheKafka原始碼
日誌分析-apache日誌分析
2024-04-28
Apache
Unity效能分析（二）CPU/GPU分析
2024-04-30
UnityGPU
SWOT分析、PEST分析、GE矩陣、波士屯矩陣等分析方法
2009-03-25
矩陣
資料分析師招聘分析2.0
2020-08-24
Java集合框架分析(五)LinkedHashMap分析
2019-11-05
Java框架HashMap
詞法分析的前奏：字元分析（三）
2020-12-27
詞法分析字元
Retrofit原始碼分析三原始碼分析
2018-05-17
原始碼
二值影象分析之輪廓分析
2017-05-02
Spark原始碼分析之DiskBlockMangaer分析
2017-11-10
Spark原始碼BloC
Spark原始碼分析之cahce原理分析
2017-11-11
Spark原始碼
Unity效能分析（三）記憶體分析
2024-04-30
Unity記憶體
軟體需求與分析業務建模分析
2024-10-30
Facebook 分析
2019-10-12
今日分析
2019-03-25
CyclicBarrier 分析
2021-05-31
javaBean分析
2018-12-13
JavaBean
SparseArray分析
2018-07-31
文字分析
2021-11-16
效能分析
2016-09-15
索引分析
2016-09-14
索引
CMSampleBuffer 分析
2018-04-17
ArrayList分析
2018-04-12
表分析
2017-02-20
分析HWM
2015-04-16

kafka.network.SocketServer分析

問題：

(1) Acceptor是如何把新來的連線分配給對應的Processor，這個演算法是什麼？是round robin嗎？

(2) Processor應該把對應的SocketChannel在自己的Selector上如何註冊？

(3) Processor如何讀取請求？

(4) Processor如何接收Handler產生的response?

相關文章