文章目錄
我一直認為,對於從事 Web 前端開發的同學來說,HTTP 協議以及其他常見的網路知識屬於必備項。一方面,前端很多工作如 Web 效能優化,大部分規則都跟 HTTP、HTTPS、SPDY 和 TCP 等協議的特點直接對應,如果不從協議本身出發而是一味地照辦教條,很可能適得其反。另一方面,隨著 Node 的發展壯大,越來越多的前端同學開始寫服務端程式,甚至是框架(ThinkJS 就是這樣由前端工程師開發,並有著眾多前端工程師使用者的 Node 框架),掌握必要的網路知識,對於服務端程式安全、部署、運維等工作來說至關重要。
背景
通過名字就知道,X-Forwarded-For 是一個擴充套件頭。HTTP/1.1(RFC 2616)協議並沒有對它的定義,它最開始是由 Squid 這個快取代理軟體引入,用來表示 HTTP 請求端真實 IP,現在已經成為事實上的標準,被各大 HTTP 代理、負載均衡等轉發服務廣泛使用,並被寫入 RFC 7239(Forwarded HTTP Extension)標準之中。
X-Forwarded-For 請求頭格式非常簡單,就這樣:
1 |
X-Forwarded-For: client, proxy1, proxy2 |
可以看到,XFF 的內容由「英文逗號 + 空格」隔開的多個部分組成,最開始的是離服務端最遠的裝置 IP,然後是每一級代理裝置的 IP。
如果一個 HTTP 請求到達伺服器之前,經過了三個代理 Proxy1、Proxy2、Proxy3,IP 分別為 IP1、IP2、IP3,使用者真實 IP 為 IP0,那麼按照 XFF 標準,服務端最終會收到以下資訊:
1 |
X-Forwarded-For: IP0, IP1, IP2 |
Proxy3 直連伺服器,它會給 XFF 追加 IP2,表示它是在幫 Proxy2 轉發請求。列表中並沒有 IP3,IP3 可以通過服務端的 Remote Address 欄位獲得。我們知道 HTTP 連線基於 TCP 連線,HTTP 協議中沒有 IP 的概念,Remote Address 來自 TCP 連線,表示與服務端建立 TCP 連線的裝置 IP,在這個例子裡就是 IP3。
Remote Address 無法偽造,因為建立 TCP 連線需要三次握手,如果偽造了源 IP,無法建立 TCP 連線,更不會有後面的 HTTP 請求。不同語言獲取 Remote Address 的方式不一樣,例如 php 是 $_SERVER["REMOTE_ADDR"]
,Node 是 req.connection.remoteAddress
,但原理都一樣。
問題
有了上面的背景知識,開始說問題。我用 Node 寫了一個最簡單的 Web Server 用於測試。HTTP 協議跟語言無關,這裡用 Node 只是為了方便演示,換成任何其他語言都可以得到相同結論。另外本文用 Nginx 也是一樣的道理,如果有興趣,換成 Apache 或其他 Web Server 也一樣。
下面這段程式碼會監聽 9009
埠,並在收到 HTTP 請求後,輸出一些資訊:
1 2 3 4 5 6 7 8 9 |
var http = require('http'); http.createServer(function (req, res) { res.writeHead(200, {'Content-Type': 'text/plain'}); res.write('remoteAddress: ' + req.connection.remoteAddress + 'n'); res.write('x-forwarded-for: ' + req.headers['x-forwarded-for'] + 'n'); res.write('x-real-ip: ' + req.headers['x-real-ip'] + 'n'); res.end(); }).listen(9009, '0.0.0.0'); |
這段程式碼除了前面介紹過的 Remote Address 和 X-Forwarded-For
,還有一個 X-Real-Ip
,這又是一個自定義頭。X-Real-Ip
通常被 HTTP 代理用來表示與它產生 TCP 連線的裝置 IP,這個裝置可能是其他代理,也可能是真正的請求端。需要注意的是,X-Real-Ip
目前並不屬於任何標準,代理和 Web 應用之間可以約定用任何自定義頭來傳遞這個資訊。
現在可以用域名 + 埠號直接訪問這個 Node 服務,再配一個 Nginx 反向代理:
1 2 3 4 5 6 7 8 9 |
location / { proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header Host $http_host; proxy_set_header X-NginX-Proxy true; proxy_pass http://127.0.0.1:9009/; proxy_redirect off; } |
我的 Nginx 監聽 80
埠,所以不帶埠就可以訪問 Nginx 轉發過的服務。
測試直接訪問 Node 服務:
1 2 3 4 5 |
curl http://t1.imququ.com:9009/ remoteAddress: 114.248.238.236 x-forwarded-for: undefined x-real-ip: undefined |
由於我的電腦直接連線了 Node 服務,Remote Address 就是我的 IP。同時我並未指定額外的自定義頭,所以後兩個欄位都是 undefined。
再來訪問 Nginx 轉發過的服務:
1 2 3 4 5 |
curl http://t1.imququ.com/ remoteAddress: 127.0.0.1 x-forwarded-for: 114.248.238.236 x-real-ip: 114.248.238.236 |
這一次,我的電腦是通過 Nginx 訪問 Node 服務,得到的 Remote Address 實際上是 Nginx 的本地 IP。而前面 Nginx 配置中的這兩行起作用了,為請求額外增加了兩個自定義頭:
1 2 |
proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; |
實際上,在生產環境中部署 Web 應用,一般都採用上面第二種方式,好處多多,具體是哪些不是本文重點不寫了。這就引入一個隱患:很多 Web 應用為了獲取使用者真正的 IP,從 HTTP 請求頭中獲取 IP。
HTTP 請求頭可以隨意構造,我們通過 curl 的 -H
引數構造 X-Forwarded-Fox
和 X-Real-Ip
,再來測試一把。
直接訪問 Node 服務:
1 2 3 4 5 |
curl http://t1.imququ.com:9009/ -H 'X-Forwarded-For: 1.1.1.1' -H 'X-Real-Ip: 2.2.2.2' remoteAddress: 114.248.238.236 x-forwarded-for: 1.1.1.1 x-real-ip: 2.2.2.2 |
對於 Web 應用來說,X-Forwarded-Fox
和 X-Real-Ip
就是兩個普通的請求頭,自然就不做任何處理原樣輸出了。這說明,對於直連部署方式,除了從 TCP 連線中得到的 Remote Address 之外,請求頭中攜帶的 IP 資訊都不能信。
訪問 Nginx 轉發過的服務:
1 2 3 4 5 |
curl http://t1.imququ.com/ -H 'X-Forwarded-For: 1.1.1.1' -H 'X-Real-Ip: 2.2.2.2' remoteAddress: 127.0.0.1 x-forwarded-for: 1.1.1.1, 114.248.238.236 x-real-ip: 114.248.238.236 |
這一次,Nginx 會在 X-Forwarded-For
後追加我的 IP;並用我的 IP 覆蓋 X-Real-Ip
請求頭。這說明,有了 Nginx 的加工,X-Forwarded-For
最後一節以及 X-Real-Ip
整個內容無法構造,可以用於獲取使用者 IP。
使用者 IP 往往被使用在跟 Web 安全有關的場景上,例如檢查使用者登入地區,基於 IP 做訪問頻率控制等等。這種場景下,確保 IP 無法構造更重要。經過前面的測試和分析,對於直接面向使用者部署的 Web 應用,必須使用從 TCP 連線中得到的 Remote Address;對於部署了 Nginx 這樣反向代理的 Web 應用,在正確配置了 Set Header 行為後,可以使用 Nginx 傳過來的 X-Real-Ip
或 X-Forwarded-Ip
最後一節(實際上它們一定等價)。
那麼,Web 應用自身如何判斷請求是直接過來,還是由可控的代理轉發來的呢?在代理轉發時增加額外的請求頭是一個辦法,但是不怎麼保險,因為請求頭太容易構造了。如果一定要這麼用,這個自定義頭要夠長夠罕見,還要保管好不能洩露出去。
判斷 Remote Address 是不是本地 IP 也是一種辦法,不過也不完善,因為在 Nginx 所處伺服器上訪問,無論直連還是走 Nginx 代理,Remote Address 都是 127.0.0.1。這個問題還好通常可以忽略,更麻煩的是,反向代理伺服器和實際的 Web 應用不一定部署在同一臺伺服器上。所以更合理的做法是收集所有代理伺服器 IP 列表,Web 應用拿到 Remote Address 後逐一比對來判斷是以何種方式訪問。
通常,為了簡化邏輯,生產環境會封掉通過帶埠直接訪問 Web 應用的形式,只允許通過 Nginx 來訪問。那是不是這樣就沒問題了呢?也不見得。
首先,如果使用者真的是通過代理訪問 Nginx,X-Forwarded-For
最後一節以及 X-Real-Ip
得到的是代理的 IP,安全相關的場景只能用這個,但有些場景如根據 IP 顯示所在地天氣,就需要儘可能獲得使用者真實 IP,這時候 X-Forwarded-For
中第一個 IP 就可以排上用場了。這時候需要注意一個問題,還是拿之前的例子做測試:
1 2 3 4 |
curl http://t1.imququ.com/ -H 'X-Forwarded-For: unknown, "1.1.1.1' remoteAddress: 127.0.0.1 x-forwarded-for: unknown, "1.1.1.1, 114.248.238.236 x-real-ip: 114.248.238.236 |
X-Forwarded-For
最後一節是 Nginx 追加上去的,但之前部分都來自於 Nginx 收到的請求頭,這部分使用者輸入內容完全不可信。使用時需要格外小心,符合 IP 格式才能使用,不然容易引發 SQL 注入或 XSS 等安全漏洞。
結論
- 直接對外提供服務的 Web 應用,在進行與安全有關的操作時,只能通過 Remote Address 獲取 IP,不能相信任何請求頭;
- 使用 Nginx 等 Web Server 進行反向代理的 Web 應用,在配置正確的前提下,要用
X-Forwarded-For
最後一節 或X-Real-Ip
來獲取 IP(因為 Remote Address 得到的是 Nginx 所在伺服器的內網 IP);同時還應該禁止 Web 應用直接對外提供服務; - 在與安全無關的場景,例如通過 IP 顯示所在地天氣,可以從
X-Forwarded-For
靠前的位置獲取 IP,但是需要校驗 IP 格式合法性;
PS:網上有些文章建議這樣配置 Nginx,其實並不合理:
1 2 |
proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $remote_addr; |
這樣配置之後,安全性確實提高了,但是也導致請求到達 Nginx 之前的所有代理資訊都被抹掉,無法為真正使用代理的使用者提供更好的服務。還是應該弄明白這中間的原理,具體場景具體分析。