HTTP/2做錯了什麼?剛剛輝煌2年就要被棄用了!?

HollisChuang發表於2020-12-14

GitHub 19k Star 的Java工程師成神之路,不來了解一下嗎!

GitHub 19k Star 的Java工程師成神之路,真的不來了解一下嗎!

GitHub 19k Star 的Java工程師成神之路,真的真的不來了解一下嗎!

最近一段時間以來,關於HTTP/3的新聞有很多,越來越多的國際大公司已經開始使用HTTP/3了。

所以,HTTP/3已經是箭在弦上了,全面使用只是個時間問題,那麼,作為一線開發者,我們也是時候瞭解下到底什麼是HTTP/3,為什麼需要HTTP/3了。

於是,我準備開始寫這篇文章,但是要想把HTTP/3的事情說清楚,一定繞不過的問題就是HTTP/2,所以寫著寫著,篇幅越來越多,於是我就把他們分成了上下兩篇。

這一篇我們主要來回顧下HTTP/2,然後再來重點看一下HTTP/2存在哪些問題,為什麼要被棄用。

HTTP/2 輝煌不在?

雖然HTTP/2標準在2015年5月就以RFC 7540正式發表了,並且多數瀏覽器在2015年底就支援了。

但是,真正被廣泛使用起來要到2018年左右,但是也是在2018年,11月IETF給出了官方批准,認可HTTP-over-QUIC成為HTTP/3。

2018年的時候,我寫過一篇文章介紹《HTTP/2到底是什麼?》,那時候HTTP/2還是個新技術,剛剛開始有軟體支援,短短兩年過去了,現在HTTP/3已經悄然而至了。

根據W3Techs的資料,截至2019年6月,全球也僅有36.5%的網站支援了HTTP/2。所以,可能很多網站還沒開始支援HTTP/2,HTTP/3就已經來了。

所以,對於很多網站來說,或許直接升級HTTP/3是一個更加正確的選擇。

回顧 HTTP/2

在閱讀本文之前,強烈建議大家先閱讀下《HTTP/2到底是什麼?》這篇文章,這裡面介紹了HTTP的歷史,介紹了各個版本的HTTP協議的誕生的背景。

當你讀到這裡的時候,我預設大家對HTTP/2有了一定的基本瞭解。

我們知道,HTTP/2的誕生,主要是為了解決HTTP/1.1中的效率問題,HTTP/2中最核心的技術就是多路複用技術,即允許同時通過單一的HTTP/2.0連線發起多重的請求-響應訊息。

同時還實現了二進位制分幀、header壓縮、服務端推送等技術。

從HTTP/1.0誕生,一直到HTTP/2,在這24年裡,HTTP協議已經做過了三次升級,但是有一個關鍵的技術點是不變的,那就是這所有的HTTP協議,都是基於TCP協議實現的。

流水的HTTP,鐵打的TCP。這是因為相對於UDP協議,TCP協議更加可靠。

雖然在HTTP/1.1的基礎上推出HTTP/2大大的提升了效率,但是還是有很多人認為這只是個"臨時方案",這也是為什麼剛剛推出沒多久,業內就開始大力投入HTTP/3的研發與推廣了。

而這背後的深層次原因也正是因為他還是基於TCP協議實現的。TCP協議雖然更加可靠,但是還是存在著一定的問題,接下來具體分析下。

HTTP/2 問題

隊頭阻塞

隊頭阻塞翻譯自英文head-of-line blocking,這個詞並不新鮮,因為早在HTTP/1.1時代,就一直存在著隊頭阻塞的問題。

但是很多人在一些資料中會看到有論點說HTTP/2解決了隊頭阻塞的問題。但是這句話只對了一半。

只能說HTTP/2解決了HTTP的隊頭阻塞問題,但是並沒有解決TCP隊頭阻塞問題!

如果大家對於HTTP的歷史有一定的瞭解的話,就會知道。HTTP/1.1相比較於HTTP/1.0來說,最主要的改進就是引入了持久連線(keep-alive)。

所謂的持久連線就是:在一個TCP連線上可以傳送多個HTTP請求和響應,減少了建立和關閉連線的消耗和延遲。

引入了持久連線之後,在效能方面,HTTP協議有了明顯的提升。

另外,HTTP/1.1允許在持久連線上使用請求管道,是相對於持久連線的又一效能優化。

所謂請求管道,就是在HTTP響應到達之前,可以將多條請求放入佇列,當第一條HTTP請求通過網路流向伺服器時,第二條和第三條請求也可以開始傳送了。在高時延網路條件下,這樣做可以降低網路的環回時間,提高效能。

但是,對於管道連線還是有一定的限制和要求的,其中一個比較關鍵的就是服務端必須按照與請求相同的順序回送HTTP響應。

這也就意味著,如果一個響應返回發生了延遲,那麼其後續的響應都會被延遲,直到隊頭的響應送達。這就是所謂的HTTP隊頭阻塞

但是HTTP隊頭阻塞的問題在HTTP/2中得到了有效的解決。HTTP/2廢棄了管道化的方式,而是創新性的引入了幀、訊息和資料流等概念。客戶端和伺服器可以把 HTTP 訊息分解為互不依賴的幀,然後亂序傳送,最後再在另一端把它們重新組合起來。

因為沒有順序了,所以就不需要阻塞了,就有效的解決了HTTP對隊頭阻塞的問題。

但是,HTTP/2仍然會存在TCP隊頭阻塞的問題,那是因為HTTP/2其實還是依賴TCP協議實現的。

TCP傳輸過程中會把資料拆分為一個個按照順序排列的資料包,這些資料包通過網路傳輸到了接收端,接收端再按照順序將這些資料包組合成原始資料,這樣就完成了資料傳輸。

但是如果其中的某一個資料包沒有按照順序到達,接收端會一直保持連線等待資料包返回,這時候就會阻塞後續請求。這就發生了TCP隊頭阻塞

HTTP/1.1的管道化持久連線也是使得同一個TCP連結可以被多個HTTP使用,但是HTTP/1.1中規定一個域名可以有6個TCP連線。而HTTP/2中,同一個域名只是用一個TCP連線。

所以,在HTTP/2中,TCP隊頭阻塞造成的影響會更大,因為HTTP/2的多路複用技術使得多個請求其實是基於同一個TCP連線的,那如果某一個請求造成了TCP隊頭阻塞,那麼多個請求都會受到影響。

TCP握手時長

一提到TCP協議,大家最先想到的一定是他的三次握手與四次關閉的特性。

因為TCP是一種可靠通訊協議,而這種可靠就是靠三次握手實現的,通過三次握手,TCP在傳輸過程中可以保證接收方收到的資料是完整,有序,無差錯的。

但是,問題是三次握手是需要消耗時間的,這裡插播一個關於網路延遲的概念。

網路延遲又稱為 RTT(Round Trip Time)。他是指一個請求從客戶端瀏覽器傳送一個請求資料包到伺服器,再從伺服器得到響應資料包的這段時間。RTT 是反映網路效能的一個重要指標。

我們知道,TCP三次握手的過程客戶端和伺服器之間需要互動三次,那麼也就是說需要消耗1.5 RTT。

另外,如果使用的是安全的HTTPS協議,就還需要使用TLS協議進行安全資料傳輸,這個過程又要消耗一個RTT(TLS不同版本的握手機制不同,這裡按照最小的消耗來算)

那麼也就是說,一個純HTTP/2的連線,需要消耗1.5個RTT,如果是一個HTTPS連線,就需要消耗3-4個RTT。

而具體消耗的時長根據伺服器和客戶端之間的距離則不盡相同,如果比較近的話,消耗在100ms以內,對於用來說可能沒什麼感知,但是如果一個RTT的耗時達到300-400ms,那麼,一次連線建立過程總耗時可能要達到一秒鐘左右,這時候,使用者就會明顯的感知到網頁載入很慢。

升級TCP是否可行?

基於上面我們提到的這些問題,很多人提出來說:既然TCP存在這些問題,並且我們也知道這些問題的存在,甚至解決方案也不難想到,為什麼不能對協議本身做一次升級,解決這些問題呢?

其實,這就涉及到一個"協議僵化"的問題。

這樣講,我們在網際網路上瀏覽資料的時候,資料的傳輸過程其實是極其複雜的。

我們知道的,想要在家裡使用網路有幾個前提,首先我們要通過執行商開通網路,並且需要使用路由器,而路由器就是網路傳輸過程中的一箇中間裝置。

中間裝置是指插入在資料終端和訊號轉換裝置之間,完成調製前或解調後某些附加功能的輔助裝置。例如集線器、交換機和無線接入點、路由器、安全解調器、通訊伺服器等都是中間裝置。

在我們看不到的地方,這種中間裝置還有很多很多,一個網路需要經過無數箇中間裝置的轉發才能到達終端使用者。

如果TCP協議需要升級,那麼意味著需要這些中間裝置都能支援新的特性,我們知道路由器我們可以重新換一個,但是其他的那些中間裝置呢?尤其是那些比較大型的裝置呢?更換起來的成本是巨大的。

而且,除了中間裝置之外,作業系統也是一個重要的因素,因為TCP協議需要通過作業系統核心來實現,而作業系統的更新也是非常滯後的。

所以,這種問題就被稱之為"中間裝置僵化",也是導致"協議僵化"的重要原因。這也是限制著TCP協議更新的一個重要原因。

所以,近些年來,由IETF標準化的許多TCP新特性都因缺乏廣泛支援而沒有得到廣泛的部署或使用!

放棄TCP?

上面提到的這些問題的根本原因都是因為HTTP/2是基於TPC實現導致的,而TCP協議自身的升級又是很難實現的。

那麼,剩下的解決辦法就只有一條路,那就是放棄TCP協議。

放棄TCP的話,就又有兩個新的選擇,是使用其他已有的協議,還是重新創造一個協議呢?

看到這裡,聰明的讀者一定也想到了,創造新的協議一樣會受到中間裝置僵化的影響。近些年來,因為在網際網路上部署遭遇很大的困難,創造新型傳輸層協議的努力基本上都失敗了!

所以,想要升級新的HTTP協議,那麼就只剩一條路可以走了,那就是基於已有的協議做一些改造和支援,UDP就是一個絕佳的選擇了。

總結

因為HTTP/2底層是採用TCP協議實現的,雖然解決了HTTP隊頭阻塞的問題,但是對於TCP隊頭阻塞的問題卻無能為力。

TCP傳輸過程中會把資料拆分為一個個按照順序排列的資料包,這些資料包通過網路傳輸到了接收端,接收端再按照順序將這些資料包組合成原始資料,這樣就完成了資料傳輸。

但是如果其中的某一個資料包沒有按照順序到達,接收端會一直保持連線等待資料包返回,這時候就會阻塞後續請求。這就發生了TCP隊頭阻塞

另外,TCP這種可靠傳輸是靠三次握手實現的,TCP三次握手的過程客戶端和伺服器之間需要互動三次,那麼也就是說需要消耗1.5 RTT。如果是HTTPS那麼消耗的RTT就更多。

而因為很多中間裝置比較陳舊,更新換代成本巨大,這就導致TCP協議升級或者採用新的協議基本無法實現。

所以,HTTP/3選擇了一種新的技術方案,那就是基於UDP做改造,這種技術叫做QUIC。

那麼問題來了,HTTP/3是如何使用的UDP呢?做了哪些改造?如何保證連線的可靠性?UDP協議就沒有僵化的問題了嗎?

這些問題我們在下一篇中深入分析。敬請期待!

參考資料:

https://http3-explained.haxx.se/

https://baike.baidu.com/item/中間裝置/3688874

https://time.geekbang.org/column/article/150159

https://juejin.cn/post/6844903853985366023

https://time.geekbang.org/column/article/279164

相關文章