你確信 X-Forwarded-For 拿到的就是用戶真實 IP 嗎?

X-Forwarded-For 拿到的就是真實 IP 嗎?

1.故事

在這個小節開始前,我先講一個開發中的小故事,可以加深一下大家對這個欄位的理解。

前段時間要做一個和風控相關的需求,需要拿到用戶的 IP,開發後灰度了一小部分用戶,測試發現後台日誌里灰度的用戶 IP 全是異常的,哪有這麼巧的事情。隨後測試發過來幾個異常 IP:

10.148.2.122
10.135.2.38
10.149.12.33
...

一看 IP 特徵我就明白了,這幾個 IP 都是 10 開頭的,屬於 A 類 IP 的私有 IP 範圍(10.0.0.0-10.255.255.255),後端拿到的肯定是代理伺服器的 IP,而不是用戶的真實 IP。

2.原理

image-20200524154345598
image-20200524154345598

現在有些規模的網站基本都不是單點 Server 了,為了應對更高的流量和更靈活的架構,應用服務一般都是隱藏在代理伺服器之後的,比如說 Nginx。

加入接入層後,我們就能比較容易的實現多台伺服器的負載均衡和服務升級,當然還有其他的好處,比如說更好的內容快取和安全防護,不過這些不是本文的重點就不展開了。

網站加入代理伺服器後,除了上面的幾個優點,同時引入了一些新的問題。比如說之前的單點 Server,伺服器是可以直接拿到用戶的 IP 的,加入代理層後,如上圖所示,(應用)原始伺服器拿到的是代理伺服器的 IP,我前面講的故事的問題就出在這裡。

Web 開發這麼成熟的領域,肯定是有現成的解決辦法的,那就是 X-Forwarded-For 請求頭。

X-Forwarded-For 是一個事實標準,雖然沒有寫入 HTTP RFC 規範里,從普及程度上看其實可以算 HTTP 規範了。

這個標準是這樣定義的,每次代理伺服器轉發請求到下一個伺服器時,要把代理伺服器的 IP 寫入 X-Forwarded-For 中,這樣在最末端的應用服務收到請求時,就會得到一個 IP 列表:

X-Forwarded-For: client, proxy1, proxy2

因為 IP 是一個一個依次 push 進去的,那麼第一個 IP 就是用戶的真實 IP,取來用就好了。

但是,事實有這麼簡單嗎?

3.攻擊

從安全的角度上考慮,整個系統最不安全的就是人,用戶端都是最好攻破最好偽造的。有些用戶就開始鑽協議的漏洞:X-Forwarded-For 是代理伺服器添加的,如果我一開始請求的 Header 頭裡就加了 X-Forwarded-For ,不就騙過伺服器了嗎?

1. 首先從客戶端發出請求,帶有 X-Forwarded-For 請求頭,裡面寫一個偽造的 IP:

X-Forwarded-For: fakeIP

2. 服務端第一層代理服務收到請求,發現已經有 X-Forwarded-For,誤把這個請求當成代理伺服器,於是向這個欄位追加了客戶端的真實 IP:

X-Forwarded-For: fakeIP, client

3. 經過幾層代理後,最終的伺服器拿到的 Header 是這樣的:

X-Forwarded-For: fakeIP, client, proxy1, proxy2

要是按照取 X-Forwarded-For 第一個 IP 的思路,你就著了攻擊者的道了,你拿到的是 fakeIP,而不是 client IP。

4.破招

服務端如何破招?上面三個步驟:

  • 第一步是客戶端造假,伺服器無法介入
  • 第二步是代理伺服器,可控,可防範
  • 第三步是應用伺服器,可控,可防範

第二步的破解我拿 Nginx 伺服器舉例。

我們在最外層的 Nginx 上,對 X-Forwarded-For 的配置如下:

proxy_set_header X-Forwarded-For $remote_addr;

什麼意思呢?就是最外層代理伺服器不信任客戶端的 X-Forwarded-For 輸入,直接覆蓋,而不是追加

非最外層的 Nginx 伺服器,我們配置:

proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

$proxy_add_x_forwarded_for 就是追加 IP 的意思。通過這招,就可以破解用戶端的偽造辦法。

第三步的破解思路也很容易,正常思路我們是取X-Forwarded-For 最左側的 IP,這次我們反其道而行之,從右邊數,減去代理伺服器的數目,那麼剩下的 IP 里,最右邊的就是真實 IP。

X-Forwarded-For: fakeIP, client, proxy1, proxy2

比如說我們已知代理服務有兩層,從右向左數,把 proxy1proxy2 去掉,剩下的 IP 列表最右邊的就是真實 IP。

相關思路和程式碼實現可參考 Egg.js 前置代理模式

5.一句話總結總結

通過 X-Forwarded-For 獲取用戶真實 IP 時,最好不要取第一個 IP,以防止用戶偽造 IP。


文章推薦

下面我要推薦我的幾篇文章:



最後推薦一下我的個人公眾號:「滷蛋實驗室」,平時會分享一些前端技術和數據分析的內容,大家感興趣的話可以關注一波: