如何用 UDP 實現可靠傳輸?

小林coding發表於2022-06-06

作者:小林coding

計算機八股文刷題網站:https://xiaolincoding.com

大家好,我是小林。

我記得之前在群裡看到,有位讀者位元組一面的時候被問到:「如何基於 UDP 協議實現可靠傳輸?

很多同學第一反應就會說把 TCP 可靠傳輸的特性(序列號、確認應答、超時重傳、流量控制、擁塞控制)在應用層實現一遍。

實現的思路確實這樣沒錯,但是有沒有想過,既然 TCP 天然支援可靠傳輸,為什麼還需要基於 UDP 實現可靠傳輸呢?這不是重複造輪子嗎?

所以,我們要先弄清楚 TCP 協議有哪些痛點?而這些痛點是否可以在基於 UDP 協議實現的可靠傳輸協議中得到改進?

在之前這篇文章:TCP 就沒什麼缺陷嗎?,我已經說了 TCP 協議四個方面的缺陷:

  • 升級 TCP 的工作很困難;
  • TCP 建立連線的延遲;
  • TCP 存在隊頭阻塞問題;
  • 網路遷移需要重新建立 TCP 連線;

現在市面上已經有基於 UDP 協議實現的可靠傳輸協議的成熟方案了,那就是 QUIC 協議,已經應用在了 HTTP/3。

這次,聊聊 QUIC 是如何實現可靠傳輸的?又是如何解決上面 TCP 協議四個方面的缺陷

QUIC 是如何實現可靠傳輸的?

要基於 UDP 實現的可靠傳輸協議,那麼就要在應用層下功夫,也就是要設計好協議的頭部欄位。

拿 HTTP/3 舉例子,在 UDP 報文頭部與 HTTP 訊息之間,共有 3 層頭部:

整體看的視角是這樣的:

接下來,分別對每一個 Header 做個介紹。

Packet Header

Packet Header 首次建立連線時和日常傳輸資料時使用的 Header 是不同的。如下圖(注意我沒有把 Header 所有欄位都畫出來,只是畫出了重要的欄位):

Packet HeaderPacket Header

Packet Header 細分這兩種:

  • Long Packet Header 用於首次建立連線。
  • Short Packet Header 用於日常傳輸資料。

QUIC 也是需要三次握手來建立連線的,主要目的是為了協商連線 ID。協商出連線 ID 後,後續傳輸時,雙方只需要固定住連線 ID,從而實現連線遷移功能。所以,你可以看到日常傳輸資料的 Short Packet Header 不需要在傳輸 Source Connection ID 欄位了,只需要傳輸 Destination Connection ID。

Short Packet Header 中的 Packet Number 是每個報文獨一無二的編號,它是嚴格遞增的,也就是說就算 Packet N 丟失了,重傳的 Packet N 的 Packet Number 已經不是 N,而是一個比 N 大的值。

為什麼要這麼設計呢?

我們先來看看 TCP 的問題,TCP 在重傳報文時的序列號和原始報文的序列號是一樣的,也正是由於這個特性,引入了 TCP 重傳的歧義問題。

TCP 重傳的歧義問題TCP 重傳的歧義問題

比如上圖,當 TCP 發生超時重傳後,客戶端發起重傳,然後接收到了服務端確認 ACK 。由於客戶端原始報文和重傳報文序列號都是一樣的,那麼服務端針對這兩個報文回覆的都是相同的 ACK。

這樣的話,客戶端就無法判斷出是「原始報文的響應」還是「重傳報文的響應」,這樣在計算 RTT(往返時間) 時應該選擇從傳送原始報文開始計算,還是重傳原始報文開始計算呢?

  • 如果算成原始報文的響應,但實際上是重傳報文的響應(上圖左),會導致取樣 RTT 變大;
  • 如果算成重傳報文的響應,但實際上是原始報文的響應(上圖右),又很容易導致取樣 RTT 過小;

RTO (超時時間)是基於 RTT 來計算的,那麼如果 RTT 計算不精準,那麼 RTO (超時時間)也會不精確,這樣可能導致重傳的概率事件增大。

QUIC 報文中的 Pakcet Number 是嚴格遞增的, 即使是重傳報文,它的 Pakcet Number 也是遞增的,這樣就能更加精確計算出報文的 RTT。

如果 ACK 的 Packet Number 是 N+M,就根據重傳報文計算取樣 RTT。如果 ACK 的 Pakcet Number 是 N,就根據原始報文的時間計算取樣 RTT,沒有歧義性的問題。

另外,還有一個好處,QUIC 使用的 Packet Number 單調遞增的設計,可以讓資料包不再像 TCP 那樣必須有序確認,QUIC 支援亂序確認,當資料包Packet N 丟失後,只要有新的已接收資料包確認,當前視窗就會繼續向右滑動(後面講流量控制的時候,會舉例子)。

待傳送端獲知資料包Packet N 丟失後,會將需要重傳的資料包放到待傳送佇列,重新編號比如資料包Packet N+M 後重新傳送給接收端,對重傳資料包的處理跟傳送新的資料包類似,這樣就不會因為丟包重傳將當前視窗阻塞在原地,從而解決了隊頭阻塞問題。

所以,Packet Number 單調遞增的兩個好處:

  • 可以更加精確計算 RTT,沒有 TCP 重傳的歧義性問題;
  • 可以支援亂序確認,因為丟包重傳將當前視窗阻塞在原地,而 TCP 必須是順序確認的,丟包時會導致視窗不滑動;

QUIC Frame Header

一個 Packet 報文中可以存放多個 QUIC Frame。

每一個 Frame 都有明確的型別,針對型別的不同,功能也不同,自然格式也不同。

我這裡只舉例 Stream 型別的 Frame 格式,Stream 可以認為就是一條 HTTP 請求,它長這樣:

  • Stream ID 作用:多個併發傳輸的 HTTP 訊息,通過不同的 Stream ID 加以區別,類似於 HTTP2 的 Stream ID;
  • Offset 作用:類似於 TCP 協議中的 Seq 序號,保證資料的順序性和可靠性
  • Length 作用:指明瞭 Frame 資料的長度。

在前面介紹 Packet Header 時,說到 Packet Number 是嚴格遞增,即使重傳報文的 Packet Number 也是遞增的,既然重傳資料包的 Packet N+M 與丟失資料包的 Packet N 編號並不一致,我們怎麼確定這兩個資料包的內容一樣呢?

所以引入 Frame Header 這一層,通過 Stream ID + Offset 欄位資訊實現資料的有序性,通過比較兩個資料包的 Stream ID 與 Stream Offset ,如果都是一致,就說明這兩個資料包的內容一致。

舉個例子,下圖中,資料包 Packet N 丟失了,後面重傳該資料包的編號為 Packet N+2,丟失的資料包和重傳的資料包 Stream ID 與 Offset 都一致,說明這兩個資料包的內容一致。這些資料包傳輸到接收端後,接收端能根據 Stream ID 與 Offset 欄位資訊將 Stream x 和 Stream x+y 按照順序組織起來,然後交給應用程式處理。

總的來說,QUIC 通過單向遞增的 Packet Number,配合 Stream ID 與 Offset 欄位資訊,可以支援亂序確認而不影響資料包的正確組裝,擺脫了TCP 必須按順序確認應答 ACK 的限制,解決了 TCP 因某個資料包重傳而阻塞後續所有待傳送資料包的問題。

QUIC 是如何解決 TCP 隊頭阻塞問題的?

什麼是 TCP 隊頭阻塞問題?

TCP 隊頭阻塞的問題要從兩個角度看,一個是傳送視窗的隊頭阻塞,另外一個是接收視窗的隊頭阻塞

1、傳送視窗的隊頭阻塞。

TCP 傳送出去的資料,都是需要按序確認的,只有在資料都被按順序確認完後,傳送視窗才會往前滑動。

舉個例子,比如下圖的傳送方把傳送視窗內的資料全部都發出去了,可用視窗的大小就為 0 了,表明可用視窗耗盡,在沒收到 ACK 確認之前是無法繼續傳送資料了。

可用視窗耗盡可用視窗耗盡

接著,當傳送方收到對第 32~36 位元組的 ACK 確認應答後,則滑動視窗往右邊移動 5 個位元組,因為有 5 個位元組的資料被應答確認,接下來第 52~56 位元組又變成了可用視窗,那麼後續也就可以傳送 52~56 這 5 個位元組的資料了。

32 ~ 36 位元組已確認32 ~ 36 位元組已確認

但是如果某個資料包文丟失或者其對應的 ACK 報文在網路中丟失,會導致傳送方無法移動傳送視窗,這時就無法再傳送新的資料,只能超時重傳這個資料包文,直到收到這個重傳報文的 ACK,傳送視窗才會移動,繼續後面的傳送行為。

舉個例子,比如下圖,客戶端是傳送方,伺服器是接收方。

客戶端傳送了第 5~9 位元組的資料,但是第 5 位元組的 ACK 確認報文在網路中丟失了,那麼即使客戶端收到第 6~9 位元組的 ACK 確認報文,傳送視窗也不會往前移動。

此時的第 5 位元組相當於“隊頭”,因為沒有收到“隊頭”的 ACK 確認報文,導致傳送視窗無法往前移動,此時傳送方就無法繼續傳送後面的資料,相當於按下了傳送行為的暫停鍵,這就是傳送視窗的隊頭阻塞問題

2、接收視窗的隊頭阻塞。

接收方收到的資料範圍必須在接收視窗範圍內,如果收到超過接收視窗範圍的資料,就會丟棄該資料,比如下圖接收視窗的範圍是 32 ~ 51 位元組,如果收到第 52 位元組以上資料都會被丟棄。

接收視窗接收視窗

接收視窗什麼時候才能滑動?當接收視窗收到有序資料時,接收視窗才能往前滑動,然後那些已經接收並且被確認的「有序」資料就可以被應用層讀取。

但是,當接收視窗收到的資料不是有序的,比如收到第 33~40 位元組的資料,由於第 32 位元組資料沒有收到, 接收視窗無法向前滑動,那麼即使先收到第 33~40 位元組的資料,這些資料也無法被應用層讀取的。只有當傳送方重傳了第 32 位元組資料並且被接收方收到後,接收視窗才會往前滑動,然後應用層才能從核心讀取第 32~40 位元組的資料。

好了,至此傳送視窗和接收視窗的隊頭阻塞問題都說完了,這兩個問題的原因都是因為 TCP 必須按序處理資料,也就是 TCP 層為了保證資料的有序性,只有在處理完有序的資料後,滑動視窗才能往前滑動,否則就停留。

  • 停留「傳送視窗」會使得傳送方無法繼續傳送資料。

  • 停留「接收視窗」會使得應用層無法讀取新的資料。

其實也不能怪 TCP 協議,它本來設計目的就是為了保證資料的有序性。

HTTP/2 的隊頭阻塞

HTTP/2 通過抽象出 Stream 的概念,實現了 HTTP 併發傳輸,一個 Stream 就代表 HTTP/1.1 裡的請求和響應。

HTTP/2HTTP/2

在 HTTP/2 連線上,不同 Stream 的幀是可以亂序傳送的(因此可以併發不同的 Stream ),因為每個幀的頭部會攜帶 Stream ID 資訊,所以接收端可以通過 Stream ID 有序組裝成 HTTP 訊息,而同一 Stream 內部的幀必須是嚴格有序的。

但是 HTTP/2 多個 Stream 請求都是在一條 TCP 連線上傳輸,這意味著多個 Stream 共用同一個 TCP 滑動視窗,那麼當發生資料丟失,滑動視窗是無法往前移動的,此時就會阻塞住所有的 HTTP 請求,這屬於 TCP 層隊頭阻塞

沒有隊頭阻塞的 QUIC

QUIC 也借鑑 HTTP/2 裡的 Stream 的概念,在一條 QUIC 連線上可以併發傳送多個 HTTP 請求 (Stream)。

但是 QUIC 給每一個 Stream 都分配了一個獨立的滑動視窗,這樣使得一個連線上的多個 Stream 之間沒有依賴關係,都是相互獨立的,各自控制的滑動視窗

假如 Stream2 丟了一個 UDP 包,也只會影響 Stream2 的處理,不會影響其他 Stream,與 HTTP/2 不同,HTTP/2 只要某個流中的資料包丟失了,其他流也會因此受影響。

QUIC 是如何做流量控制的?

TCP 流量控制是通過讓「接收方」告訴「傳送方」,它(接收方)的接收視窗有多大,從而讓「傳送方」根據「接收方」的實際接收能力控制傳送的資料量。

QUIC 實現流量控制的方式:

  • 通過 window_update 幀告訴對端自己可以接收的位元組數,這樣傳送方就不會傳送超過這個數量的資料。
  • 通過 BlockFrame 告訴對端由於流量控制被阻塞了,無法傳送資料。

在前面說到,TCP 的接收視窗在收到有序的資料後,接收視窗才能往前滑動,否則停止滑動;TCP 的傳送視窗在收到對已傳送資料的順序確認 ACK後,傳送視窗才能往前滑動,否則停止滑動。

QUIC 是基於 UDP 傳輸的,而 UDP 沒有流量控制,因此 QUIC 實現了自己的流量控制機制,QUIC 的滑動視窗滑動的條件跟 TCP 有一點差別,但是同一個 Stream 的資料也是要保證順序的,不然無法實現可靠傳輸,因此同一個 Stream 的資料包丟失了,也會造成視窗無法滑動。

QUIC 的 每個 Stream 都有各自的滑動視窗,不同 Stream 互相獨立,隊頭的 Stream A 被阻塞後,不妨礙 StreamB、C的讀取。而對於 HTTP/2 而言,所有的 Stream 都跑在一條 TCP 連線上,而這些 Stream 共享一個滑動視窗,因此同一個Connection內,Stream A 被阻塞後,StreamB、C 必須等待。

QUIC 實現了兩種級別的流量控制,分別為 Stream 和 Connection 兩種級別:

  • Stream 級別的流量控制:Stream 可以認為就是一條 HTTP 請求,每個 Stream 都有獨立的滑動視窗,所以每個 Stream 都可以做流量控制,防止單個 Stream 消耗連線(Connection)的全部接收緩衝。
  • Connection 流量控制:限制連線中所有 Stream 相加起來的總位元組數,防止傳送方超過連線的緩衝容量。

Stream 級別的流量控制

最開始,接收方的接收視窗初始狀態如下(網上的講 QUIC 流量控制的資料太少了,下面的例子我是參考 google 文件的:Flow control in QUIC):

接著,接收方收到了傳送方傳送過來的資料,有的資料被上層讀取了,有的資料丟包了,此時的接收視窗狀況如下:

可以看到,接收視窗的左邊界取決於接收到的最大偏移位元組數,此時的接收視窗 = 最大視窗數 - 接收到的最大偏移數

這裡就可以看出 QUIC 的流量控制和 TCP 有點區別了:

  • TCP 的接收視窗只有在前面所有的 Segment 都接收的情況下才會移動左邊界,當在前面還有位元組未接收但收到後面位元組的情況下,視窗也不會移動。
  • QUIC 的接收視窗的左邊界滑動條件取決於接收到的最大偏移位元組數。

PS:但是你要問我這麼設計有什麼好處?我也暫時沒想到,因為資料太少了,至今沒找到一個合理的說明,如果你知道,歡迎告訴我啊!

那接收視窗右邊界觸發的滑動條件是什麼呢?看下圖:

接收視窗觸發的滑動接收視窗觸發的滑動

當圖中的綠色部分資料超過最大接收視窗的一半後,最大接收視窗向右移動,接收視窗的右邊界也向右擴充套件,同時給對端傳送「視窗更新幀」,當傳送方收到接收方的視窗更新幀後,傳送視窗的右邊界也會往右擴充套件,以此達到視窗滑動的效果。

綠色部分的資料是已收到的順序的資料,如果中途丟失了資料包,導致綠色部分的資料沒有超過最大接收視窗的一半,那接收視窗就無法滑動了,這個隻影響同一個 Stream,其他 Stream 是不會影響的,因為每個 Stream 都有各自的滑動視窗。

在前面我們說過 QUIC 支援亂序確認,具體是怎麼做到的呢?

接下來,舉個例子(下面的例子來源於:QUIC——快速UDP網路連線協議):

如圖所示,當前傳送方的緩衝區大小為8,傳送方 QUIC 按序(offset順序)傳送 29-36 的資料包:

31、32、34資料包先到達,基於 offset 被優先亂序確認,但 30 資料包沒有確認,所以當前已提交的位元組偏移量不變,傳送方的快取區不變。

imgimg

30 到達並確認,傳送方的快取區收縮到閾值,接收方傳送 MAX_STREAM_DATA Frame(協商快取大小的特定幀)給傳送方,請求增長最大絕對位元組偏移量。

imgimg

協商完畢後最大絕對位元組偏移量右移,傳送方的快取區變大,同時傳送方發現資料包33超時

imgimg

傳送方將超時資料包重新編號為 42 繼續傳送

imgimg

以上就是最基本的資料包傳送-接收過程,控制資料傳送的唯一限制就是最大絕對位元組偏移量,該值是接收方基於當前已經提交的偏移量(連續已確認並向上層應用提交的資料包offset)和傳送方協商得出。

Connection 流量控制

而對於 Connection 級別的流量視窗,其接收視窗大小就是各個 Stream 接收視窗大小之和。

Connection 流量控制Connection 流量控制

上圖所示的例子,所有 Streams 的最大視窗數為 120,其中:

  • Stream 1 的最大接收偏移為 100,可用視窗 = 120 - 100 = 20
  • Stream 2 的最大接收偏移為 90,可用視窗 = 120 - 90 = 30
  • Stream 3 的最大接收偏移為 110,可用視窗 = 120 - 110 = 10

那麼整個 Connection 的可用視窗 = 20 + 30 + 10 = 60

可用視窗 = Stream 1 可用視窗 + Stream 2 可用視窗 + Stream 3 可用視窗

QUIC 對擁塞控制改進

QUIC 協議當前預設使用了 TCP 的 Cubic 擁塞控制演算法(我們熟知的慢開始、擁塞避免、快重傳、快恢復策略),同時也支援 CubicBytes、Reno、RenoBytes、BBR、PCC 等擁塞控制演算法,相當於將 TCP 的擁塞控制演算法照搬過來了。

QUIC 是如何改進 TCP 的擁塞控制演算法的呢?

QUIC 是處於應用層的,應用程式層面就能實現不同的擁塞控制演算法,不需要作業系統,不需要核心支援。這是一個飛躍,因為傳統的 TCP 擁塞控制,必須要端到端的網路協議棧支援,才能實現控制效果。而核心和作業系統的部署成本非常高,升級週期很長,所以 TCP 擁塞控制演算法迭代速度是很慢的。而 QUIC 可以隨瀏覽器更新,QUIC 的擁塞控制演算法就可以有較快的迭代速度

TCP 更改擁塞控制演算法是對系統中所有應用都生效,無法根據不同應用設定不同的擁塞控制策略。但是因為 QUIC 處於應用層,所以就可以針對不同的應用設定不同的擁塞控制演算法,這樣靈活性就很高了。

QUIC 更快的連線建立

對於 HTTP/1 和 HTTP/2 協議,TCP 和 TLS 是分層的,分別屬於核心實現的傳輸層、openssl 庫實現的表示層,因此它們難以合併在一起,需要分批次來握手,先 TCP 握手(1RTT),再 TLS 握手(2RTT),所以需要 3RTT 的延遲才能傳輸資料,就算 Session 會話服用,也需要至少 2 個 RTT。

HTTP/3 在傳輸資料前雖然需要 QUIC 協議握手,這個握手過程只需要 1 RTT,握手的目的是為確認雙方的「連線 ID」,連線遷移就是基於連線 ID 實現的。

但是 HTTP/3 的 QUIC 協議並不是與 TLS 分層,而是QUIC 內部包含了 TLS,它在自己的幀會攜帶 TLS 裡的“記錄”,再加上 QUIC 使用的是 TLS1.3,因此僅需 1 個 RTT 就可以「同時」完成建立連線與金鑰協商,甚至在第二次連線的時候,應用資料包可以和 QUIC 握手資訊(連線資訊 + TLS 資訊)一起傳送,達到 0-RTT 的效果

如下圖右邊部分,HTTP/3 當會話恢復時,有效負載資料與第一個資料包一起傳送,可以做到 0-RTT(下圖的右下角):

QUIC 是如何遷移連線的?

基於 TCP 傳輸協議的 HTTP 協議,由於是通過四元組(源 IP、源埠、目的 IP、目的埠)確定一條 TCP 連線。

TCP 四元組TCP 四元組

那麼當移動裝置的網路從 4G 切換到 WIFI 時,意味著 IP 地址變化了,那麼就必須要斷開連線,然後重新建立 TCP 連線

而建立連線的過程包含 TCP 三次握手和 TLS 四次握手的時延,以及 TCP 慢啟動的減速過程,給使用者的感覺就是網路突然卡頓了一下,因此連線的遷移成本是很高的。

QUIC 協議沒有用四元組的方式來“繫結”連線,而是通過連線 ID來標記通訊的兩個端點,客戶端和伺服器可以各自選擇一組 ID 來標記自己,因此即使移動裝置的網路變化後,導致 IP 地址變化了,只要仍保有上下文資訊(比如連線 ID、TLS 金鑰等),就可以“無縫”地複用原連線,消除重連的成本,沒有絲毫卡頓感,達到了連線遷移的功能。


參考資料:

  • https://www.taohui.tech/2021/02/04/%E7%BD%91%E7%BB%9C%E5%8D%8F%E8%AE%AE/%E6%B7%B1%E5%85%A5%E5%89%96%E6%9E%90HTTP3%E5%8D%8F%E8%AE%AE/
  • https://zhuanlan.zhihu.com/p/32553477

系列 TCP 文章:

相關文章