計算機網路 - TCP粘包、拆包以及解決方案

b9x_發表於2018-04-24

轉自:http://blog.insanecoder.top/tcp-packet-splice-and-split-issue/

在進行Java NIO學習時,發現,如果客戶端連續不斷的向服務端傳送資料包時,服務端接收的資料會出現兩個資料包粘在一起的情況,這就是TCP協議中經常會遇到的粘包以及拆包的問題。

我們都知道TCP屬於傳輸層的協議,傳輸層除了有TCP協議外還有UDP協議。那麼UDP是否會發生粘包或拆包的現象呢?答案是不會。UDP是基於報文傳送的,從UDP的幀結構可以看出,在UDP首部採用了16bit來指示UDP資料包文的長度,因此在應用層能很好的將不同的資料包文區分開,從而避免粘包和拆包的問題。而TCP是基於位元組流的,雖然應用層和TCP傳輸層之間的資料互動是大小不等的資料塊,但是TCP把這些資料塊僅僅看成一連串無結構的位元組流,沒有邊界;另外從TCP的幀結構也可以看出,在TCP的首部沒有表示資料長度的欄位,基於上面兩點,在使用TCP傳輸資料時,才有粘包或者拆包現象發生的可能。

粘包、拆包表現形式

現在假設客戶端向服務端連續傳送了兩個資料包,用packet1和packet2來表示,那麼服務端收到的資料可以分為三種,現列舉如下:

第一種情況,接收端正常收到兩個資料包,即沒有發生拆包和粘包的現象,此種情況不在本文的討論範圍內。normal

第二種情況,接收端只收到一個資料包,由於TCP是不會出現丟包的,所以這一個資料包中包含了傳送端傳送的兩個資料包的資訊,這種現象即為粘包。這種情況由於接收端不知道這兩個資料包的界限,所以對於接收端來說很難處理。one

第三種情況,這種情況有兩種表現形式,如下圖。接收端收到了兩個資料包,但是這兩個資料包要麼是不完整的,要麼就是多出來一塊,這種情況即發生了拆包和粘包。這兩種情況如果不加特殊處理,對於接收端同樣是不好處理的。half_oneone_half

粘包、拆包發生原因

發生TCP粘包或拆包有很多原因,現列出常見的幾點,可能不全面,歡迎補充,

1、要傳送的資料大於TCP傳送緩衝區剩餘空間大小,將會發生拆包。

2、待傳送資料大於MSS(最大報文長度),TCP在傳輸前將進行拆包。

3、要傳送的資料小於TCP傳送緩衝區的大小,TCP將多次寫入緩衝區的資料一次傳送出去(採用Nagle演算法,是TCP為了提高效率),將會發生粘包。

4、接收資料端的應用層沒有及時讀取接收緩衝區中的資料,將發生粘包。

等等

粘包、拆包解決辦法

通過以上分析,我們清楚了粘包或拆包發生的原因,那麼如何解決這個問題呢?解決問題的關鍵在於如何給每個資料包新增邊界資訊,常用的方法有如下幾個:

1、傳送端給每個資料包新增包首部,首部中應該至少包含資料包的長度,這樣接收端在接收到資料後,通過讀取包首部的長度欄位,便知道每一個資料包的實際長度了。

2、傳送端將每個資料包封裝為固定長度(不夠的可以通過補0填充),這樣接收端每次從接收緩衝區中讀取固定長度的資料就自然而然的把每個資料包拆分開來。

3、可以在資料包之間設定邊界,如新增特殊符號,這樣,接收端通過這個邊界就可以將不同的資料包拆分開。

等等

附:TCP Nagle演算法的思路: 如果想傳送一個1位元組的業務資料, 還需要加上一些包頭, 實際傳送的資料遠遠大於1位元組, 這樣就很浪費了, 還不如把這帶傳送的n個1位元組業務資料粘起來, 一起傳送。

相關文章