本文引用了作者Fundebug的“一文搞懂TCP與UDP的區別”一文的內容,感謝無私分享。
1、引言
網路協議是每個搞網路通訊應用開發(比如IM、推送、閘道器等等)的程式設計師都必須要掌握的基礎知識,TCP/IP協議簇中有兩個最具有代表性的傳輸層協議——分別是 TCP 和 UDP。
有過網路通訊開發經驗的同學們都知道,TCP和UDP協議是平時用的最多的兩種協議,而對於很多人來說,什麼時候以及什麼場景下該用TCP還是UDP?這是個經久不息的討論話題。
不同於其它長篇大論,本文儘量以簡潔精煉的文字,幫你總結歸納TCP和UDP協議的主要區別,方便那些想掌握這方面知識又不願意耗費太多時間去系統地學習網路理論基礎的同學快速理解!
推薦閱讀:為了加深理解,本系列的另一篇《網路程式設計懶人入門(四):快速理解TCP和UDP的差異》也可以一併閱讀。
學習交流:
- 移動端IM開發入門文章:《新手入門一篇就夠:從零開發移動端IM》
- 開源IM框架原始碼:https://github.com/JackJiang2...
(本文已同步釋出於:http://www.52im.net/thread-37... )
2、快速理解TCP/IP協議簇
計算機與網路裝置要相互通訊,雙方就必須基於相同的方法。比如:如何探測到通訊目標、由哪一邊先發起通訊、使用哪種語言進行通訊、怎樣結束通訊等規則都需要事先確定。不同的硬體、作業系統之間的通訊,所有的這一切都需要一種規則。而我們就把這種規則稱為協議(protocol)。
TCP/IP 是網際網路相關的各類協議族的總稱,比如:TCP,UDP,IP,FTP,HTTP,ICMP,SMTP 等都屬於 TCP/IP 族內的協議。
TCP/IP模型是網際網路的基礎,它是一系列網路協議的總稱。這些協議可以劃分為四層,分別為鏈路層、網路層、傳輸層和應用層。
具體是:
1)鏈路層:負責封裝和解封裝IP報文,傳送和接受ARP/RARP報文等;
2)網路層:負責路由以及把分組報文傳送給目標網路或主機;
3)傳輸層:負責對報文進行分組和重組,並以TCP或UDP協議格式封裝報文;
4)應用層:負責向使用者提供應用程式,比如HTTP、FTP、Telnet、DNS、SMTP等。
下面這張表格進行了了歸納:
下面這張圖,更生動的反映了TCP/IP協議族的關係情況(高清圖從這裡下載):
在網路體系結構中,網路通訊的建立必須是在通訊雙方的對等層進行,不能交錯。
在整個資料傳輸過程中,資料在傳送端時經過各層時都要附加上相應層的協議頭和協議尾(僅資料鏈路層需要封裝協議尾)部分,也就是要對資料進行協議封裝,以標識對應層所用的通訊協議。
有關TCP/IP協議簇的知識,幾本書都寫不完,這裡我就不再贅述了,有興趣可以讀一讀《TCP/IP詳解 卷1:協議(線上閱讀)》。
另外,學習知識,我特別喜歡瞭解技術之外的一些知識,比如下面兩篇:
《技術往事:改變世界的TCP/IP協議(珍貴多圖、手機慎點)》
《5G時代已經到來,TCP/IP老矣,尚能飯否?》
接下來,我們將回到正題,學習TCP/IP 中有兩個具有代表性的傳輸層協議——TCP 和 UDP。
3、快速理解UDP協議
3.1 基本介紹
UDP協議:全稱是使用者資料包協議,在網路中它與TCP協議一樣用於處理資料包,是一種無連線的協議。
在OSI模型中,處在第四層——傳輸層,處於IP協議的上一層(見下圖)。
▲ 上圖引用自《計算機網路通訊協議關係圖》
UDP有不提供資料包分組、組裝和不能對資料包進行排序的缺點,也就是說,當報文傳送之後,是無法得知其是否安全完整到達的。
UDP協議的幾個主要特別,我進行歸納,下面的下節將逐一說明。
3.2 面向無連線
首先 UDP 是不需要和 TCP一樣在傳送資料前進行三次握手建立連線的,想發資料就可以開始傳送了。並且也只是資料包文的搬運工,不會對資料包文進行任何拆分和拼接操作。
具體來說就是:
1)在傳送端:應用層將資料傳遞給傳輸層的 UDP 協議,UDP 只會給資料增加一個 UDP 頭標識下是 UDP 協議,然後就傳遞給網路層了;
2)在接收端:網路層將資料傳遞給傳輸層,UDP 只去除 IP 報文頭就傳遞給應用層,不會任何拼接操作。
3.3 支援單播、多播、廣播
UDP 不止支援一對一的傳輸方式,同樣支援一對多,多對多,多對一的方式,也就是說 UDP 提供了單播、多播、廣播的功能。
3.4 面向報文
UDP協議是面向報文的。
傳送方的UDP對應用程式交下來的報文,在新增首部後就向下交付IP層。UDP對應用層交下來的報文,既不合並,也不拆分,而是保留這些報文的邊界。
因此,應用程式必須選擇合適大小的報文(見《UDP中一個包的大小最大能多大?》)。
3.5 不可靠性
UDP的不可靠性首先體現在無連線上,通訊的雙方不需要建立連線,想發就發,這樣的情況肯定不可靠。
並且收到什麼資料就傳遞什麼資料,並且也不會備份資料,傳送資料也不會關心對方是否已經正確接收到資料了。
再者網路環境時好時壞,但是 UDP 因為沒有擁塞控制,一直會以恆定的速度傳送資料(即使網路條件不好,也不會對傳送速率進行調整)。
這樣實現的弊端就是在網路條件不好的情況下可能會導致丟包,但是優點也很明顯,在某些實時性要求高的場景(比如電話會議)就需要使用 UDP 而不是 TCP(見《網路程式設計懶人入門(五):快速理解為什麼說UDP有時比TCP更有優勢》)。
下面這個動圖可以很好的說明UDP的不可靠性:
從上面的動圖可以得知,UDP只會把想發的資料包文一股腦的丟給對方,並不在意資料有無安全完整到達。
3.6 頭部開銷小
UDP協議頭部開銷小(如下圖所示),傳輸資料包文時是很高效的。
▲ 上圖引用自《TCP/IP詳解 - 第11章·UDP協議》
UDP 頭部包含了以下幾個資料:
1)兩個十六位的埠號,分別為源埠(可選欄位)和目標埠;
2)整個資料包文的長度;
3)整個資料包文的檢驗和(IPv4 可選 欄位),該欄位用於發現頭部資訊和資料中的錯誤。
因此 UDP 的頭部開銷小,只有8位元組,相比 TCP 的至少20位元組要少得多,在傳輸資料包文時是很高效的。
作為對比,下圖是TCP協議的頭部開銷:
▲ 上圖引用自《TCP/IP詳解 - 第17章·TCP協議》
3.7 更全面地學習UDP協議
UDP協議相對來說比較簡單易學,如果覺得理論上有所欠缺,可以通過網路經典書籍《TCP/IP詳解 - 第11章·UDP:使用者資料包協議》中的章節來補充。
其實生產應用時,UDP協議也有它複雜的一面,下面這幾篇值得學習一下:
《不為人知的網路程式設計(五):UDP的連線性和負載均衡》
《不為人知的網路程式設計(六):深入地理解UDP協議並用好它》
《不為人知的網路程式設計(七):如何讓不可靠的UDP變的可靠?》
另外,隨著近年來Google等網際網路大廠大力推廣Quic協議,UDP協議在新時代移動網際網路環境下或許能找到更多的應用場景,有興趣的讀者可以學習一下QUIC協議:《網路程式設計懶人入門(十):一泡尿的時間,快速讀懂QUIC協議》、《技術掃盲:新一代基於UDP的低延時網路傳輸層協議——QUIC詳解》、《讓網際網路更快:新一代QUIC協議在騰訊的技術實踐分享》。
4、快速理解TCP協議
4.1 基本介紹
當一臺計算機想要與另一臺計算機通訊時,兩臺計算機之間的通訊需要暢通且可靠,這樣才能保證正確收發資料。
例如:當你想檢視網頁或檢視電子郵件時,希望完整且按順序檢視網頁,而不丟失任何內容。當你下載檔案時,希望獲得的是完整的檔案,而不僅僅是檔案的一部分,因為如果資料丟失或亂序,都不是你希望得到的結果,於是就用到了TCP。
TCP協議:全稱是傳輸控制協議是一種面向連線的、可靠的、基於位元組流的傳輸層通訊協議,由 IETF 的RFC 793定義。
TCP 是面向連線的、可靠的流協議。流就是指不間斷的資料結構,你可以把它想象成排水管中的水流。
有關TCP協議的理論可以繼續閱讀《TCP/IP詳解 - 第17章·TCP:傳輸控制協議》,限於篇幅這裡就展開了。
接下來我們逐個介紹TCP最主要的幾個特點。
4.2 TCP連線過程(3次握手)
如下圖所示,這是建立一個TCP連線的過程(俗稱“3次握手”):
1)第一次握手:客戶端向服務端傳送連線請求報文段。該報文段中包含自身的資料通訊初始序號。請求傳送後,客戶端便進入 SYN-SENT 狀態。
2)第二次握手:服務端收到連線請求報文段後,如果同意連線,則會傳送一個應答,該應答中也會包含自身的資料通訊初始序號,傳送完成後便進入 SYN-RECEIVED 狀態。
3)第三次握手:當客戶端收到連線同意的應答後,還要向服務端傳送一個確認報文。客戶端發完這個報文段後便進入 ESTABLISHED 狀態,服務端收到這個應答後也進入 ESTABLISHED 狀態,此時連線建立成功。
這裡可能大家會有個疑惑:為什麼 TCP 建立連線需要三次握手,而不是兩次?這是因為這是為了防止出現失效的連線請求報文段被服務端接收的情況,從而產生錯誤。
下面的動畫演示了3次握手過程,可能更好懂一些:
▲ 動圖引用自《跟著動畫來學TCP三次握手和四次揮手》
4.3 TCP斷開連結(4次揮手)
TCP 是全雙工的,如上圖所示,在斷開連線時兩端都需要傳送 FIN 和 ACK。
1)第一次揮手:若客戶端 A 認為資料傳送完成,則它需要向服務端 B 傳送連線釋放請求。
2)第二次揮手:B 收到連線釋放請求後,會告訴應用層要釋放 TCP 連結。然後會傳送 ACK 包,並進入 CLOSE_WAIT 狀態,此時表明 A 到 B 的連線已經釋放,不再接收 A 發的資料了。但是因為 TCP 連線是雙向的,所以 B 仍舊可以傳送資料給 A。
3)第三次揮手:B 如果此時還有沒發完的資料會繼續傳送,完畢後會向 A 傳送連線釋放請求,然後 B 便進入 LAST-ACK 狀態。
4)第四次揮手:A 收到釋放請求後,向 B 傳送確認應答,此時 A 進入 TIME-WAIT 狀態。該狀態會持續 2MSL(最大段生存期,指報文段在網路中生存的時間,超時會被拋棄) 時間,若該時間段內沒有 B 的重發請求的話,就進入 CLOSED 狀態。當 B 收到確認應答後,也便進入 CLOSED 狀態。
關於TCP的4次揮手,下面的動畫或許更生動一些:
▲ 動圖引用自《跟著動畫來學TCP三次握手和四次揮手》
正確理解TCP 3次握手和4次揮手過程,是非常重要的,限於篇幅,本文沒辦法進一步深入展開,有興趣的同事可以進一步深入閱讀以幾篇專題文章:
《腦殘式網路程式設計入門(一):跟著動畫來學TCP三次握手和四次揮手》
《理論經典:TCP協議的3次握手與4次揮手過程詳解》
《理論聯絡實際:Wireshark抓包分析TCP 3次握手、4次揮手過程》
4.4 TCP協議要點歸納
1)面向連線:
面向連線,是指傳送資料之前必須在兩端建立連線。
建立連線的方法是“三次握手”,這樣能建立可靠的連線。建立連線,是為資料的可靠傳輸打下了基礎。
2)僅支援單播傳輸:
每條TCP傳輸連線只能有兩個端點,只能進行點對點的資料傳輸,不支援多播和廣播傳輸方式。
3)面向位元組流:
TCP不像UDP一樣那樣一個個報文獨立地傳輸,而是在不保留報文邊界的情況下以位元組流方式進行傳輸。
4)可靠傳輸:
對於可靠傳輸、判斷丟包、誤碼,靠的是TCP的段編號以及確認號。
TCP為了保證報文傳輸的可靠,就給每個包一個序號,同時序號也保證了傳送到接收端實體的包的按序接收。
然後接收端實體對已成功收到的位元組發回一個相應的確認(ACK):如果傳送端實體在合理的往返時延(RTT)內未收到確認,那麼對應的資料(假設丟失了)將會被重傳。
關於可靠傳輸的理論,可以深入學習《TCP/IP詳解 - 第21章·TCP的超時與重傳》,這裡就不深入展開了。
5)提供擁塞控制:
當網路出現擁塞的時候,TCP能夠減小向網路注入資料的速率和數量,緩解擁塞。
TCP中有關擁塞控制的文章通都比較枯燥,這篇《通俗易懂-深入理解TCP協議(下):RTT、滑動視窗、擁塞處理》相對來說講的比較易懂,有興趣可以深入讀讀。
6)TCP提供全雙工通訊:
TCP允許通訊雙方的應用程式在任何時候都能傳送資料,因為TCP連線的兩端都設有快取,用來臨時存放雙向通訊的資料。
當然,TCP可以立即傳送一個資料段,也可以快取一段時間以便一次傳送更多的資料段(最大的資料段大小取決於MSS)。
4.5 更全面地學習TCP協議
TCP協議涉及的內容比較豐富,真要方方面面展來講,三天三夜也講不完。不過,對於網路應用的開發者來說,根據自已應用所涉及技術的深度按需學習就可以了。
初學者建議先把理論夯實,比如從《TCP/IP詳解 - 第17章·TCP:傳輸控制協議》這本經典書籍開始。
如果覺得理論太過乏味,下面這幾篇生動有趣的入門文章推薦一定要讀一讀:
《網路程式設計懶人入門(一):快速理解網路通訊協議(上篇)》
《網路程式設計懶人入門(二):快速理解網路通訊協議(下篇)》
《網路程式設計懶人入門(三):快速理解TCP協議一篇就夠》
《網路程式設計懶人入門(六):史上最通俗的集線器、交換機、路由器功能原理入門》
《腦殘式網路程式設計入門(一):跟著動畫來學TCP三次握手和四次揮手》
《網路程式設計入門從未如此簡單(一):假如你來設計網路,會怎麼做?》
《網路程式設計入門從未如此簡單(二):假如你來設計TCP協議,會怎麼做?》
另外,在學習TCP或者網路程式設計實踐的過程中,其它的一些網路知識也有必要了解,下面這幾篇可以讓你輕鬆的學習,不要錯過:
《腦殘式網路程式設計入門(五):每天都在用的Ping命令,它到底是什麼?》
《腦殘式網路程式設計入門(六):什麼是公網IP和內網IP?NAT轉換又是什麼鬼?》
《腦殘式網路程式設計入門(七):面視必備,史上最通俗計算機網路分層詳解》
《腦殘式網路程式設計入門(八):你真的瞭解127.0.0.1和0.0.0.0的區別?》
《腦殘式網路程式設計入門(九):面試必考,史上最通俗大小端位元組序詳解》
在生產應用中,必須要涉及到網路的高效能、高併發問題,下面這幾篇值得學習:
《高效能網路程式設計(一):單臺伺服器併發TCP連線數到底可以有多少》
《高效能網路程式設計(二):上一個10年,著名的C10K併發連線問題》
《高效能網路程式設計(三):下一個10年,是時候考慮C10M併發問題了》
《高效能網路程式設計(四):從C10K到C10M高效能網路應用的理論探索》
《從根上理解高效能、高併發(一):深入計算機底層,理解執行緒與執行緒池》
《從根上理解高效能、高併發(二):深入作業系統,理解I/O與零拷貝技術》
《從根上理解高效能、高併發(三):深入作業系統,徹底理解I/O多路複用》
《從根上理解高效能、高併發(四):深入作業系統,徹底理解同步與非同步》
《從根上理解高效能、高併發(五):深入作業系統,理解高併發中的協程》
《從根上理解高效能、高併發(六):通俗易懂,高效能伺服器到底是如何實現的》
《從根上理解高效能、高併發(七):深入作業系統,一文讀懂程式、執行緒、協程》
隨著TCP協議應用的深度不斷擴充,一定會遇到各種疑難雜症:
《不為人知的網路程式設計(一):淺析TCP協議中的疑難雜症(上篇)》
《不為人知的網路程式設計(二):淺析TCP協議中的疑難雜症(下篇)》
《不為人知的網路程式設計(三):關閉TCP連線時為什麼會TIME_WAIT、CLOSE_WAIT》
《不為人知的網路程式設計(四):深入研究分析TCP的異常關閉》
對於TCP協議來說,知道的越多越覺無知,下面這幾篇或許可以徹底為你解開一些疑惑,不可多得:
《不為人知的網路程式設計(十):深入作業系統,從核心理解網路包的接收過程(Linux篇)》
《不為人知的網路程式設計(十一):從底層入手,深度分析TCP連線耗時的祕密》
《不為人知的網路程式設計(十二):徹底搞懂TCP協議層的KeepAlive保活機制》
《不為人知的網路程式設計(十三):深入作業系統,徹底搞懂127.0.0.1本機網路通訊》
5、總結一下
TCP和UDP的區別可以歸納為下面這張表格:
簡單來說,TCP和UDP的區別就是:
1)TCP向上層提供面向連線的可靠服務 ,UDP向上層提供無連線不可靠服務;
2)雖然 UDP 並沒有 TCP 傳輸來的準確,但是也能在很多實時性要求高的地方有所作為;
3)對資料準確性要求高,速度可以相對較慢的,可以選用TCP。
最後,想用一張圖來生動地概括一下TCP與UDP的區別:
正如上圖所示:TCP就像左邊的妹子——喝起水來有條不紊、滴水不漏,UDP就像右邊的妹子——甭管能喝到多少、倒就完了。。。
6、系列文章
本文是系列文章中的第13篇,本系列文章的大綱如下:
[1] 網路程式設計懶人入門(一):快速理解網路通訊協議(上篇)
[2] 網路程式設計懶人入門(二):快速理解網路通訊協議(下篇)
[3] 網路程式設計懶人入門(三):快速理解TCP協議一篇就夠
[4] 網路程式設計懶人入門(四):快速理解TCP和UDP的差異
[5] 網路程式設計懶人入門(五):快速理解為什麼說UDP有時比TCP更有優勢
[6] 網路程式設計懶人入門(六):史上最通俗的集線器、交換機、路由器功能原理入門
[7] 網路程式設計懶人入門(七):深入淺出,全面理解HTTP協議
[8] 網路程式設計懶人入門(八):手把手教你寫基於TCP的Socket長連線
[9] 網路程式設計懶人入門(九):通俗講解,有了IP地址,為何還要用MAC地址?
[11] 網路程式設計懶人入門(十):一泡尿的時間,快速讀懂QUIC協議
[12] 網路程式設計懶人入門(十一):一文讀懂什麼是IPv6
[13] 網路程式設計懶人入門(十二):快速讀懂Http/3協議,一篇就夠!
[14] 網路程式設計懶人入門(十三):一泡尿的時間,快速搞懂TCP和UDP的區別(* 本文)
(本文已同步釋出於:http://www.52im.net/thread-37... )