理解Nginx中Server和Location的匹配邏輯

小米運維發表於2019-03-14
本文主要介紹了Server和Location匹配邏輯相關內容。
上篇文章回顧:淺談SYNPROXY

Server的匹配邏輯

Nginx在決定請求由哪個server塊執行時,主要關注的是server塊中的listen和server_name兩個欄位

listen指令

listen欄位定義server響應的ip和埠,如果沒有明確配置listen欄位,預設監聽0.0.0.0:80(root)或者0.0.0.0:8080(非root)
listen可以被配置為:

  1. 一個ip和埠的組合

  2. 一個單獨的ip,預設監聽80埠

  3. 一個單獨的埠,預設監聽所有的ip介面

  4. 一個Unix socket路徑

其中最後一項通常只用於在不同的server之間傳遞請求
選擇要使用的server的規則如下:

  1. Nginx首先將所有"不完整"的listen指令進行轉換,比如沒有listen欄位的轉換為listen 0.0.0.0:80,listen 1.1.1.1轉換為listen 1.1.1.1:80等

  2. Nginx根據請求的ip和埠建立一個與請求最匹配的server塊列表,優先匹配指定了特定ip的server塊,其次才會選擇listen 0.0.0.0的這種server塊.但是無論是哪種情況,埠必須是完全匹配的

  3. 如果只有一個最佳匹配,那麼將使用匹配的server塊響應請求,否則開始評估每一個server塊的server_name指令

再次強調一遍,只有當listen指令無法找到最佳匹配時才會考慮評估server_name指令.
比如,我們假設example.com域名指向了192.168.0.1,且位於192.168.0.1上的nginx有且僅有如下兩個server塊:

# server block 1server {
    listen 192.168.0.1;
    server_name other.com
    ...
}

# server block 2server {
    listen 80;
    server_name example.com
    ...
}複製程式碼

Server_name指令

如果根據listen指令無法得到最佳匹配,將會開始解析server_name指令.nginx會檢查請求中的"Host"頭,這個值包含了客戶端實際試圖請求的域名或者ip地址.nginx會根據這個值去匹配server_name指令,匹配規則如下:

  1. nginx會嘗試尋找一個和sever_name和Host值完全匹配的server塊,如果找到多個精確匹配,則會使用第一個匹配的server塊

  2. 如果沒有找到精確匹配的server塊,則nginx嘗試找到server_name帶有*開頭的server塊,如果找到多個,則選擇最長匹配的server塊

  3. 如果沒有找到使用開頭的server塊,則會尋找以結尾的server塊,同樣,如果有多個匹配, 選擇最長匹配

  4. 如果沒有找到使用*匹配的server塊,則會尋找使用正規表示式(以~開頭)定義server_name的server塊,如果找到多個匹配,會使用第一個匹配

  5. 如果沒有找到正規表示式匹配的server塊,則nginx將會選擇一個匹配listen欄位的default server塊.每一個ip和埠組合都可以配置一個且只能配置一個預設的default_server塊,如果沒有的話,則會選擇可用列表中的第一個server(此時的選擇是隨機的,順序不固定)

示例如下:

(1)準確的server_name匹配,例如:

server {
     listen       80;
     server_name  www.domain.com;
     ...
}複製程式碼

(2)以*萬用字元開始的字串:

server {
     listen       80;
     server_name  *.domain.com;
     ...
}複製程式碼

(3)以*萬用字元結束的字串:

server {
     listen       80;
     server_name  www.*;
     ...
}複製程式碼

(4)匹配正規表示式:

server {
     listen       80;
     server_name  ~^(?.+)\.domain\.com$;
     ...
}複製程式碼

(5)如果以上都沒有匹配,則使用default_server.如果沒有指定default_server,則會選擇第一個可用的server.我們可以指定對於沒有匹配的host值時,返回錯誤到客戶端.可以用來防止別人把垃圾流量轉到你的網站。

server {
    listen  80   default_server;
    server_name  _;    return 444;
}複製程式碼

通過返回444這個nginx的非標準錯誤碼讓nginx斷開與瀏覽器的連線

Location的匹配邏輯

Location語法解析

location optional_modifier location_match {
    ...
}複製程式碼

其中可用的modifier修飾符如下

理解Nginx中Server和Location的匹配邏輯

判定規則
  1. nginx首先檢查基於字首的location匹配(即不包含正規表示式的匹配)

  2. 如果有使用=修飾符的location塊與請求的URL完全匹配,則立刻使用該location響應請求

  3. 如果沒有找到帶有=修飾符的location塊匹配,則會繼續計算非精確字首,根據給定的URI找到最長匹配字首,然後進行如下處理:

  4. (1)如果最長的匹配location帶有^~修飾符,nginx立刻使用該location響應請求

    (2)如果最長的匹配location不帶有^~修飾符,nginx會將該匹配暫時存起來,然後繼續後續匹配

  5. 在確定並儲存最長匹配的字首location塊後,nginx繼續檢查正規表示式匹配location(區分大小寫/不區分大小寫).如果存在正規表示式滿足要求的匹配,則會選擇與請求的URI匹配的第一個正規表示式的location來相應請求

  6. 如果沒有找到與請求的URI匹配的正規表示式location,則使用之前儲存的最長字首location響應請求

補充

  1. 通常情況下,一旦選擇使用某一個location響應請求,那麼請求將會在該location內部進行處理,而與其他location無關.但是location中某些指令會觸發新的location匹配,比如:

  2. (1)try_files

    (2)rewrite

    (3)error_page

  3. 關於為https配置default_server,參考Properly setting up a “default” nginx server for https

本文首發於公眾號“小米運維”,點選檢視原文


相關文章