聽說你的資源被盜用了，那你知道 Nginx 怎麼防盜鏈嗎？

原少子楊發表於2020-06-14

原文網址 : https://www.cnblogs.com/iziyang/p/13124912.html

上一篇文章講了 Nginx 中的變數和執行原理，下面就來說一個主要提供變數並修改變數的值的模組，也就是我們要講的防盜鏈模組：referer 模組。

簡單有效的防盜鏈手段

場景

如果做過個人站點的同學，可能會遇到別人盜用自己站點資源連結的情況，這就是盜鏈。說到盜鏈就要說一個 HTTP 協議的頭部，referer 頭部。當其他網站通過 URL 引用了你的頁面，使用者在瀏覽器上點選 URL 時，HTTP 請求的頭部會通過 referer 頭部將該網站當前頁面的 URL 帶上，告訴伺服器本次請求是由誰發起的。

例如，在谷歌中搜尋 Nginx 然後點選連結：

在開啟的新頁面中檢視請求頭會發現，請求頭中包含了 referer 頭部且值是 https://www.google.com/。

像谷歌這種我們是允許的，但是有一些其他的網站想要引用我們自己網站的資源時，就需要做一些管控了，不然豈不是誰都可以拿到連結。

目的

這裡目的其實已經很明確了，就是要拒絕非正常的網站訪問我們站點的資源。

思路

invalid_referer 變數
- referer 提供了這個變數，可以用來配置哪些 referer 頭部合法，也就是，你允許哪些網站引用你的資源。

referer 模組

要實現上面的目的，referer 模組可得算頭一號，一起看下 referer 模組怎麼用的。

預設編譯進 Nginx，通過 --without-http_referer_module 禁用

referer 模組有三個指令，下面看一下。

Syntax: valid_referers none | blocked | server_names | string ...;
Default: —
Context: server, location

Syntax: referer_hash_bucket_size size;
Default: referer_hash_bucket_size 64; 
Context: server, location

Syntax: referer_hash_max_size size;
Default: referer_hash_max_size 2048; 
Context: server, location

valid_referers 指令，配置是否允許 referer 頭部以及允許哪些 referer 訪問。
referer_hash_bucket_size 表示這些配置的值是放在雜湊表中的，指定雜湊表的大小。
referer_hash_max_size 則表示雜湊表的最大大小是多大。

這裡面最重要的是 valid_referers 指令，需要重點來說明一下。

valid_referers 指令

可以同時攜帶多個引數，表示多個 referer 頭部都生效。

引數值

none
- 允許缺失 referer 頭部的請求訪問
block：允許 referer 頭部沒有對應的值的請求訪問。例如可能經過了反向代理或者防火牆
server_names：若 referer 中站點域名與 server_name 中本機域名某個匹配，則允許該請求訪問
string：表示域名及 URL 的字串，對域名可在字首或者字尾中含有 * 萬用字元，若 referer 頭部的值匹配字串後，則允許訪問
正規表示式：若 referer 頭部的值匹配上了正則，就允許訪問

invalid_referer 變數

允許訪問時變數值為空
不允許訪問時變數值為 1

實戰

下面來看一個配置檔案。

server {
	server_name referer.ziyang.com;
    listen 80;

	error_log logs/myerror.log debug;
	root html;
	location /{
		valid_referers none blocked server_names
               		*.ziyang.com www.ziyang.org.cn/nginx/
               		~\.google\.;
		if ($invalid_referer) {
    			return 403;
		}
		return 200 'valid\n';
	}
}

那麼對於這個配置檔案而言，以下哪些請求會被拒絕呢？

curl -H 'referer: http://www.ziyang.org.cn/ttt' referer.ziyang.com/
curl -H 'referer: http://www.ziyang.com/ttt' referer.ziyang.com/
curl -H 'referer: ' referer.ziyang.com/
curl referer.ziyang.com/
curl -H 'referer: http://www.ziyang.com' referer.ziyang.com/
curl -H 'referer: http://referer.ziyang.com' referer.ziyang.com/
curl -H 'referer: http://image.baidu.com/search/detail' referer.ziyang.com/
curl -H 'referer: http://image.google.com/search/detail' referer.ziyang.com/

我們需要先來解析一下這個配置檔案。valid_referers 指令配置了哪些值呢？

 valid_referers none blocked server_names
        *.ziyang.com www.ziyang.org.cn/nginx/
        ~\.google\.;

none：表示沒有 referer 的可以訪問
blocked：表示 referer 沒有值的可以訪問
server_names：表示本機 server_name 也就是 referer.ziyang.com 可以訪問
*.ziyang.com：匹配上了正則的可以訪問
www.ziyang.org.cn/nginx/：該頁面發起的請求可以訪問
~\.google\.：google 前後都是正則匹配

下面就實際看下響應：

# 返回 403，沒有匹配到任何規則
➜  ~ curl -H 'referer: http://www.ziyang.org.cn/ttt' referer.ziyang.com/
<html>
<head><title>403 Forbidden</title></head>
<body>
<center><h1>403 Forbidden</h1></center>
<hr><center>nginx/1.17.8</center>
</body>
</html>
➜  ~ curl -H 'referer: http://image.baidu.com/search/detail' referer.ziyang.com/
<html>
<head><title>403 Forbidden</title></head>
<body>
<center><h1>403 Forbidden</h1></center>
<hr><center>nginx/1.17.8</center>
</body>
</html>
# 匹配到了 *.ziyang.com
➜  ~ curl -H 'referer: http://www.ziyang.com/ttt' referer.ziyang.com/
valid
➜  ~ curl -H 'referer: http://www.ziyang.com' referer.ziyang.com/
valid
# 匹配到了 server name
➜  ~ curl -H 'referer: http://referer.ziyang.com' referer.ziyang.com/
valid
# 匹配到了 blocked
➜  ~ curl -H 'referer: ' referer.ziyang.com/
valid
# 匹配到了 none
➜  ~ curl referer.ziyang.com/
valid
# 匹配到了 ~\.google\.
➜  ~ curl -H 'referer: http://image.google.com/search/detail' referer.ziyang.com/
valid

防盜鏈另外一種解決方案：secure_link 模組

referer 模組是一種簡單的防盜鏈手段，必須依賴瀏覽器發起請求才會有效，如果攻擊者偽造 referer 頭部的話，這種方式就失效了。

secure_link 模組是另外一種解決的方案。

它的主要原理是，通過驗證 URL 中雜湊值的方式防盜鏈。

基本過程是這個樣子的：

由伺服器（可以是 Nginx，也可以是其他 Web 伺服器）生成加密的安全連結 URL，返回給客戶端
客戶端使用安全 URL 訪問 Nginx，由 Nginx 的 secure_link 變數驗證是否通過

原理如下：

雜湊演算法是不可逆的
客戶端只能拿到執行過雜湊演算法的 URL
僅生成 URL 的伺服器，驗證 URL 是否安全的 Nginx，這兩者才儲存原始的字串
原始字串通常由以下部分有序組成：
- 資源位置。如 HTTP 中指定資源的 URI，防止攻擊者拿到一個安全 URI 後可以訪問任意資源
- 使用者資訊。如使用者的 IP 地址，限制其他使用者盜用 URL
- 時間戳。使安全 URL 及時過期
- 金鑰。僅伺服器端擁有，增加攻擊者猜測出原始字串的難度

模組：

ngx_http_secure_link_module
- 未編譯進 Nginx，需要通過 --with-http_secure_link_module 新增
變數
- secure_link
- secure_link_expires

Syntax: secure_link expression;
Default: —
Context: http, server, location

Syntax: secure_link_md5 expression;
Default: —
Context: http, server, location

Syntax: secure_link_secret word;
Default: —
Context: location

變數值及帶過期時間的配置示例

secure_link
- 值為空字串：驗證不通過
- 值為 0：URL 過期
- 值為 1：驗證通過
secure_link_expires
- 時間戳的值

命令列生成安全連結

生成 md5

echo -n '時間戳URL客戶端IP金鑰' | openssl md5 -binary | openssl base64 | tr +/ - | tr -d =

構造請求 URL

/test1.txt?md5=md5生成值&expires=時間戳（如 2147483647）

Nginx 配置

secure_link $arg_md5,$arg_expires;
- secure_link 後面必須跟兩個值，一個是引數中的 md5，一個是時間戳
secure_link_md5 "$secure_link_expires$uri$remote_addr secret";
- 按照什麼樣的順序構造原始字串

實戰

下面是一個實際的配置檔案，我這裡就不做演示了，感興趣的可以自己做下實驗。

server {
	server_name securelink.ziyang.com;
    listen 80;
	error_log  logs/myerror.log  info;
	default_type text/plain;
	location /{
		secure_link $arg_md5,$arg_expires;
        secure_link_md5 "$secure_link_expires$uri$remote_addr secret";

        if ($secure_link = "") {
            return 403;
        }

        if ($secure_link = "0") {
            return 410;
        }

		return 200 '$secure_link:$secure_link_expires\n';
	}

	location /p/ {
        secure_link_secret mysecret2;

        if ($secure_link = "") {
            return 403;
        }

        rewrite ^ /secure/$secure_link;
	}

	location /secure/ {
		alias html/;
    	internal;
	}
}

僅對 URI 進行雜湊的簡單辦法

除了上面這種相對複雜的方式防盜鏈，還有一種相對簡單的防盜鏈方式，就是隻對 URI 進行雜湊，這樣當 URI 傳

將請求 URL 分為三個部分：/prefix/hash/link
Hash 生成方式：對 “link 金鑰” 做 md5 雜湊
用 secure_link_secret secret; 配置金鑰

命令列生成安全連結

原請求
- link
生成的安全請求
- /prefix/md5/link
生成 md5
- echo -n 'linksecret' | openssl md5 –hex

Nginx 配置

secure_link_secret secret;

這個防盜鏈的方法比較簡單，那麼具體是怎麼用呢？大家都在網上下載過資源對吧，不管是電子書還是軟體，很多網站你點選下載的時候往往會彈出另外一個頁面去下載，這個新的頁面其實就是請求的 Nginx 生成的安全 URL。如果這個 URL 被拿到的話，其實還是可以用的，所以需要經常的更新金鑰來確保 URL 不會被盜用。

今天這篇文章詳細講了防盜鏈的具體用法，最近的這兩篇文章都是說的已有的變數用法，下一篇文章講一下怎麼生成新的變數。

本文首發於我的個人部落格：iziyang.github.io，所有配置檔案我已經放在了 Nginx 配置檔案，大家可以自取。

Nginx 防盜鏈
2022-12-13
Nginx
Nginx——優化與防盜鏈
2020-12-01
Nginx優化
Nginx最佳化與防盜鏈
2024-06-06
Nginx
原創內容屢屢被盜？從源頭對資源盜用說NO
2021-12-17
Nginx網頁優化與防盜鏈
2020-12-01
Nginx網頁優化
NodeJS 伺服器實現資源防盜鏈
2018-10-11
NodeJS伺服器
小程式專案如何設定資源的防盜鏈？
2018-12-05
防盜鏈的實現方法
2022-12-12
傳說中圖片防盜鏈的愛恨情仇
2019-04-17
SpringBoot整合FastDFS+Nginx整合基於Token的防盜鏈
2019-04-25
Spring BootASTNginx
node實現防盜鏈
2020-04-16
[精選] 用PHP做圖片防盜鏈，你再也盜不了圖片了？
2022-11-18
PHP
小程式如何設定資源的防盜鏈 — 隨筆小記
2018-11-28
Linux系統Nginx最佳化與防盜鏈詳細教程
2024-01-28
LinuxNginx
php偽造Referer請求反盜鏈資源
2019-01-23
PHP
一文搞定防盜鏈設計
2024-04-02
國產github崩了？是防盜鏈啦～
2022-03-29
Github
開源服務lalserver支援多種鑑權防盜鏈方式
2022-03-23
Server
拒絕薅羊毛！嚴防流量被盜刷！
2024-07-31
yj謹防銀行卡境外被盜刷
2022-03-19
springboot整合FastDFS使用實現防盜鏈功能
2024-06-25
Spring BootAST
盜賣上億條公民個人資訊，“安全刺客”怎麼防？
2022-08-15
知道Handler，那你知道HandlerThread嗎？
2020-02-21
thread
產品防盜版
2020-12-14
steam賬號被盜怎麼找回 steam找回帳號怎麼操作
2022-07-13
微信文章圖片防盜鏈處理方法
2019-02-16
《Steam賬號被盜》
2024-11-19
PHP中的構造方法和析構方法你知道怎麼用了嗎？
2020-09-23
PHP構造方法
企業雲盤幫你解決資料被盜問題
2021-01-27
IFPI：仍有38%的聽眾在聽盜版音樂
2018-10-12
七牛 CDN 時間戳防盜鏈簽名實現
2021-06-28
時間戳
什麼是IP地址盜用？又要如何預防？
2022-05-13
.htaccess 防止圖片盜鏈
2018-09-23
你知道js的可選鏈是什麼嗎？說說你對它的理解，它有什麼應用場景？
2024-12-01
JS
Linux系統Apache最佳化與防盜鏈詳細教程
2024-01-29
LinuxApache
你知道什麼是區塊鏈嗎？
2024-11-28
區塊鏈
萬嶽教育-直播教育原始碼中防盜鏈的用處有哪些？
2020-04-14
原始碼
近期大量iPhone支付寶被盜刷，扣款上萬元，到底怎麼回事？
2018-10-11
iPhone