Google、Facebook等均開始支援的HTTP3到底是個什麼鬼?

  • 2020 年 12 月 21 日
  • 筆記

GitHub 19k Star 的Java工程師成神之路,不來了解一下嗎!

最近一段時間以來,關於HTTP/3的新聞有很多,越來越多的國際大公司已經開始使用HTTP/3了。

-w649
-w659

所以,HTTP/3已經是箭在弦上了,全面使用只是個時間問題,那麼,作為一線開發者,我們也是時候了解下到底什麼是HTTP/3,為什麼需要HTTP/3了。

那麼,本文就來講解一下到底什麼是HTTP/3?他用到了哪些技術?解決了什麼問題?

HTTP/2 存在的問題

在撰寫本文之前,我專門寫了一篇文章《HTTP/2做錯了什麼?剛剛輝煌2年就要被棄用了!?》分析HTTP/2存在的問題以及背後的原因。

這裡就不詳細介紹了,強烈建議大家先閱讀下這篇文章,有助於本文的學習。

上一篇文章中我們提到過HTTP/2因為底層使用的傳輸層協議仍然是TCP,所以他存在著TCP隊頭阻塞、TCP握手延時長以及協議僵化等問題。

這導致HTTP/2雖然使用了多路復用、二進位分幀等技術,但是仍然存在著優化空間。

QUIC協議

我們知道,HTTP/2之所以”被棄用”,是因為他使用的傳輸層協議仍然是TCP,所以HTTP/3首要解決的問題就是繞開TCP。

那麼如果研發一種新的協議,同樣還是會因為受到中間設備僵化的影響,導致無法被大規模應用。所以,研發人員們想到了一種基於UDP實現的方式。

於是,Google是最先採用這種方式並付諸於實踐的,他們在2013年推出了一種叫做QUIC的協議,全稱是Quick UDP Internet Connections。

從名字中可以看出來,這是一種完全基於UDP的協議。

在設計之初,Google就希望使用這個協議來取代HTTPS/HTTP協議,使網頁傳輸速度加快。2015年6月,QUIC的網路草案被正式提交至互聯網工程任務組。2018 年 10 月,互聯網工程任務組 HTTP 及 QUIC 工作小組正式將基於 QUIC 協議的 HTTP(英語:HTTP over QUIC)重命名為HTTP/3。

所以,我們現在所提到的HTTP/3,其實就是HTTP over QUIC,即基於QUIC協議實現的HTTP。

那麼,想要了解HTTP/3的原理,只需要了解QUIC就可以了。

QUIC協議有以下特點:

  • 基於UDP的傳輸層協議:它使用UDP埠號來識別指定機器上的特定伺服器。
  • 可靠性:雖然UDP是不可靠傳輸協議,但是QUIC在UDP的基礎上做了些改造,使得他提供了和TCP類似的可靠性。它提供了數據包重傳、擁塞控制、調整傳輸節奏以及其他一些TCP中存在的特性。
  • 實現了無序、並發位元組流:QUIC的單個數據流可以保證有序交付,但多個數據流之間可能亂序,這意味著單個數據流的傳輸是按序的,但是多個數據流中接收方收到的順序可能與發送方的發送順序不同!
  • 快速握手:QUIC提供0-RTT和1-RTT的連接建立
  • 使用TLS 1.3傳輸層安全協議:與更早的TLS版本相比,TLS 1.3有著很多優點,但使用它的最主要原因是其握手所花費的往返次數更低,從而能降低協議的延遲。

那麼,QUIC到底屬於TCP/IP協議族中的那一層呢?我們知道,QUIC是基於UDP實現的,並且是HTTP/3的所依賴的協議,那麼,按照TCP/IP的分層來講,他是屬於傳輸層的,也就是和TCP、UDP屬於同一層。

如果更加細化一點的話,因為QUIC不僅僅承擔了傳輸層協議的職責,還具備了TLS的安全性相關能力,所以,可以通過下圖來理解QUIC在HTTP/3的實現中所處的位置。

接下來我們分別展開分析一下QUIC協議。先來看下他是如何建立連接的。

QUIC的連接建立

我們知道,TCP這種可靠傳輸協議需要進行三次握手,也正是因為三次握手,所以需要額外消耗1.5 RTT,而如果再加上TLS的話,則需要消耗3-4個 RTT連接。

那麼,QUIC是如何建立連接的呢?如何減少RTT的呢?

QUIC提出一種新的連接建立機制,基於這種連接接機制,實現了快速握手功能,一次QUIC連接建立可以實現使用 0-RTT 或者 1-RTT 來建立連接。

QUIC在握手過程中使用Diffie-Hellman演算法來保證數據交互的安全性併合並了它的加密和握手過程來減小連接建立過程中的往返次數。

Diffie–Hellman (以下簡稱DH)密鑰交換是一個特殊的交換密鑰的方法。它是密碼學領域內最早付諸實踐的密鑰交換方法之一。 DH可以讓雙方在完全缺乏對方(私有)資訊的前提條件下通過不安全的信道達成一個共享的密鑰。此密鑰用於對後續資訊交換進行對稱加密。

QUIC 連接的建立整體流程大致為:QUIC在握手過程中使用Diffie-Hellman演算法協商初始密鑰,初始密鑰依賴於伺服器存儲的一組配置參數,該參數會周期性的更新。初始密鑰協商成功後,伺服器會提供一個臨時隨機數,雙方根據這個數再生成會話密鑰。客戶端和伺服器會使用新生的的密鑰進行數據加解密。

以上過程主要分為兩個步驟:初始握手(Initial handshake)、最終(與重複)握手(Final (and repeat) handshake),分別介紹下這兩個過程。

初始握手(Initial handshake)

在連接開始建立時,客戶端會向服務端發送一個打招呼資訊,(inchoate client hello (CHLO)),因為是初次建立,所以,服務端會返回一個拒絕消息(REJ),表明握手未建立或者密鑰已過期。

但是,這個拒絕消息中還會包含更多的資訊(配置參數),主要有:

  • Server Config:一個伺服器配置,包括伺服器端的Diffie-Hellman演算法的長期公鑰(long term Diffie-Hellman public value)
  • Certificate Chain:用來對伺服器進行認證的信任鏈
  • Signature of the Server Config:將Server Config使用信任鏈的葉子證書的public key加密後的簽名
  • Source-Address Token:一個經過身份驗證的加密塊,包含客戶端公開可見的IP地址和伺服器的時間戳。

在客戶端接收到拒絕消息(REJ)之後,客戶端會進行數據解析,簽名驗證等操作,之後會將必要的配置快取下來。

同時,在接收到REJ之後,客戶端會為這次連接隨機產生一對自己的短期密鑰(ephemeral Diffie-Hellman private value) 和 短期公鑰(ephemeral Diffie-Hellman public value)。

之後,客戶端會將自己剛剛產生的短期公鑰打包一個Complete CHLO的消息包中,發送給服務端。這個請求的目的是將自己的短期密鑰傳輸給服務端,方便做前向保密,後面篇幅會詳細介紹。

在發送了Complete CHLO消息給到伺服器之後,為了減少RTT,客戶端並不會等到伺服器的響應,而是立刻會進行數據傳輸。

為了保證數據的安全性,客戶端會自己的短期密鑰和伺服器返回的長期公鑰進行運算,得到一個初始密鑰(initial keys)。

有了這個初識密鑰之後,客戶端就可以用這個密鑰,將想要傳輸的資訊進行加密,然後把他們安全的傳輸給服務端了。

另外一面,接收到Complete CHLO請求的伺服器,解析請求之後,就同時擁有了客戶端的短期公鑰和自己保存的長期密鑰。這樣通過運算,服務端就能得到一份和客戶端一模一樣的初始密鑰(initial keys)。

接下來他接收到客戶端使用初始密鑰加密的數據之後,就可以使用這個初識密鑰進行解密了,並且可以將自己的響應再通過這個初始密鑰進行加密後返回給客戶端。

所以,從開始建立連接一直到數據傳送,只消耗了初始連接連接建立的 1 RTT

最終(與重複)握手

那麼,之後的數據傳輸就可以使用初始密鑰(initial keys)加密了嗎?

其實並不完全是,因為初始密鑰畢竟是基於伺服器的長期公鑰產生的,而在公鑰失效前,幾乎多有的連接使用的都是同一把公鑰,所以,這其實存在著一定的危險性。

所以,為了達到前向保密 (Forward Secrecy) 的安全性,客戶端和服務端需要使用彼此的短期公鑰和自己的短期密鑰來進行運算。

在密碼學中,前向保密(英語:Forward Secrecy,FS)是密碼學中通訊協議的安全屬性,指的是長期使用的主密鑰泄漏不會導致過去的會話密鑰泄漏。

那麼現在問題是,客戶端的短期密鑰已經發送給服務端,而服務端只把自己的長期密鑰給了客戶端,並沒有給到自己的短期密鑰。

所以,服務端在收到Complete CHLO之後,會給到伺服器一個server hello(SHLO)消息,這個消息會使用初始密鑰(initial keys)進行加密。

這個CHLO消息包中,會包含一個服務端重新生成的短期公鑰。

這樣客戶端和服務端就都有了對方的短期公鑰(ephemeral Diffie-Hellman public value)。

這樣,客戶端和服務端都可以基於自己的短期密鑰和對方的短期公鑰做運算,產生一個僅限於本次連接使用的前向保密密鑰 (Forward-Secure Key),後續的請求發送,都基於這個密鑰進行加解密就可以了。

這樣,雙方就完成了最終的密鑰交換、連接的握手並且建立了QUIC連接。

當下一次要重新創建連接的時候,客戶端會從快取中取出自己之前快取下來的伺服器的長期公鑰,並重新創建一個短期密鑰,重新生成一個初識密鑰,再使用這個初始密鑰對想要傳輸的數據進行加密,向伺服器發送一個Complete CHLO 請求即可。這樣就達到了0 RTT的數據傳輸。

所以,如果是有快取的長期公鑰,那麼數據傳輸就會直接進行,準備時間是0 RTT

以上,通過使用Diffie-Hellman演算法協商密鑰,並且對加密和握手過程進行合併,大大減小連接過程的RTT ,使得基於QUIC的連接建立可以少到1 RTT甚至0 RTT。

以下,是Google官網上面的一張關於QUIC連接建立的流程圖,可以幫助大家理解這個過程。

另外,通過以上關於握手建立的過程,我們也可以知道,QUIC在整個過程中通過加解密的方式很好的保證了安全性。

多路復用

基於TCP的協議實現的HTTP有一個最大的問題那就是隊頭阻塞問題,那麼,在這方面,QUIC是如何解決這個問題的呢?

TCP傳輸過程中會把數據拆分為一個個按照順序排列的數據包,這些數據包通過網路傳輸到了接收端,接收端再按照順序將這些數據包組合成原始數據,這樣就完成了數據傳輸。

但是如果其中的某一個數據包沒有按照順序到達,接收端會一直保持連接等待數據包返回,這時候就會阻塞後續請求。這就發生了TCP隊頭阻塞。

類似於HTTP/2,QUIC在同一物理連接上可以有多個獨立的邏輯數據流,這些數據流並行在同一個連接上傳輸,且多個數據流之間間的傳輸沒有時序性要求,也不會互相影響。

數據流(Streams)在QUIC中提供了一個輕量級、有序的位元組流的抽象化

QUIC的單個數據流可以保證有序交付,但多個數據流之間可能亂序。這意味著單個數據流的傳輸是按序的,但是多個數據流中接收方收到的順序可能與發送方的發送順序不同!

也就是說同一個連接上面的多個數據流之間沒有任何依賴(不要求按照順序到達),即使某一個數據包沒有達到,也只會影響自己這個數據流,並不會影響到到其他的數據流。

連接遷移

對於TCP連接的識別,需要通過伺服器和客戶端過雙方的ip和埠四個參數進行的。在網路切換的場景中,比如手機切換網路,那麼自身的ip就會發生變化。這就導致之前的TCP連接就會失效,就需要重新建立。

這種場景對於移動端設備普及的今天來說,還是比較頻繁的。

所以,在這一點上,QUIC進行了優化。

QUIC協議使用特有的UUID來標記每一次連接,在網路環境發生變化的時候,只要UUID不變,就能不需要握手,繼續傳輸數據。

可靠性

TCP之所以被稱之為可靠鏈接,不僅僅是因為他有三次握手和四次關閉的過程,還因為他做了很多諸如流量控制、數據重傳、擁塞控制等可靠性保證。

這也是為什麼一直以來都是以TCP作為HTTP實現的重要協議的原因。

那麼,QUIC想要取代TCP,就需要在這方面也做出努力,畢竟UDP自身是不具備這些能力的。

TCP擁塞控制是TCP避免網路擁塞的演算法,是互聯網上主要的一個擁塞控制措施。經典的演算法實現有很多,諸如TCP Tahoe 和 Reno、TCP Vegas、TCP Hybla、TCP New Reno、TCP Westwood和Westwood+以及TCP BIC 和 CUBIC等等。

QUIC協議同樣實現了擁塞控制。不依賴於特定的擁塞控制演算法,並且提供了一個可插拔的介面,允許用戶實驗。默認使用了 TCP 協議的 Cubic 擁塞控制演算法。

關於流量控制,QUIC提供了基於stream和connection兩種級別的流量控制,既需要對單個 Stream 進行控制,又需要針對所有 Stream 進行總體控制。

QUIC的連接級流控,用以限制 QUIC 接收端願意分配給連接的總緩衝區,避免伺服器為某個客戶端分配任意大的快取。連接級流控與流級流控的過程基本相同,但轉發數據和接收數據的偏移限制是所有流中的總和。

弊端

以上,我們介紹了很多QUIC的相比較於TCP的優點,可以說這種協議相比較於TCP確實要優秀一些。

因為他是基於UDP的,並沒有改變UDP協議本身,只是做了一些增強,雖然可以避開中間設備僵化的問題,但是,在推廣上面也不是完全沒有問題的。

首先,很多企業、運營商和組織對53埠(DNS)以外的UDP流量會進行攔截或者限流,因為這些流量近來常被濫用於攻擊。

特別是一些現有的UDP協議和實現易受放大攻擊(amplification attack)威脅,攻擊者可以控制無辜的主機向受害者投放發送大量的流量。

所以,基於UDP的QUIC協議的傳輸可能會受到屏蔽。

另外,因為UDP一直以來定位都是不可靠連接,所以有很多中間設備對於他的支援和優化程度並不高,所以,出現丟包的可能性還是比較搞的。

總結

下表是我總結的HTTP/2和HTTP/3的異同點,有一些本文介紹過,有一些個人認為並不是特別重要的,本文中並沒有提及,大家感興趣的可以自行學習下。

特性 HTTP/2 HTTP/3
傳輸層協議 TCP 基於UDP的QUIC
默認加密
獨立的數據流
隊頭阻塞 存在TCP隊頭阻塞
報頭壓縮 HPACK QPACK
握手時延 TCP+TLS 的 1-3 RTT 0-1 RTT
連接遷移
伺服器推送
多路復用
流量控制
數據重傳
擁塞控制

參考資料:

//http3-explained.haxx.se/

The QUIC Transport Protocol: Design and Internet-Scale Deployment

//www.codenong.com/cs106840038/

//nan01ab.github.io/2018/12/QUIC.html

//medium.com/@chester.yw.chu/http-3-傳輸協議-quic-簡介-5f8806d6c8cd

關於作者:Hollis,一個對Coding有著獨特追求的人,阿里巴巴技術專家,《程式設計師的三門課》聯合作者,《Java工程師成神之路》系列文章作者。

如果您有任何意見、建議,或者想與作者交流,都可以關注公眾號【Hollis】,直接後台給我留言。

本文由部落格一文多發平台 OpenWrite 發布!