使用 ETag 和 Last-Modified 報頭減輕伺服器壓力(轉)

ZY_FlyWay發表於2018-12-29

介紹
你的網站在併發訪問很大並且無法承受壓力的情況下,你會選擇如何優化?
很多人首先會想從伺服器快取方面著手 對程式進行優化,許多不同的伺服器快取方式都有他們自己的特點,像我曾經參與的一些專案中,根據快取的命中率不同使用過 Com+/Enterprise Libiary Caching/Windows服務,靜態檔案等方式的伺服器端快取和 HTTP Compression技術,但客戶端快取往往卻被人們忽略了,即使伺服器的快取讓你的頁面訪問起來非常地快,但她依然需要依賴瀏覽器下載並輸出,而當你 加入客戶端快取時,會給你帶來非常多的好處.因為她可以對站點中訪問最頻繁的頁進行快取充分地提高 Web 伺服器的吞吐量(通常以每秒的請求數計算)以提升應用程式效能和可伸縮性。
一個線上購物調查顯示,大多數人願意去商店排隊,但在線上購物時卻不願意等待。Websense調查公司稱多達70%的上網者表示不願意在頁面讀取上超過10秒鐘。超過70%的人會因為中途速度過慢而取消當前的訂單。

基礎知識

  1. 什麼是”Last-Modified”?

在瀏覽器第一次請求某一個URL時,伺服器端的返回狀態會是200,內容是你請求的資源,同時有一個Last-Modified的屬性標記此檔案在服務期端最後被修改的時間,格式類似這樣:

Last-Modified: Fri, 12 May 2006 18:53:33 GMT

客戶端第二次請求此URL時,根據 HTTP 協議的規定,瀏覽器會向伺服器傳送 If-Modified-Since 報頭,詢問該時間之後檔案是否有被修改過:

If-Modified-Since: Fri, 12 May 2006 18:53:33 GMT

如果伺服器端的資源沒有變化,則自動返回 HTTP 304 (Not Changed.)狀態碼,內容為空,這樣就節省了傳輸資料量。當伺服器端程式碼發生改變或者重啟伺服器時,則重新發出資源,返回和第一次請求時類似。從而 保證不向客戶端重複發出資源,也保證當伺服器有變化時,客戶端能夠得到最新的資源。

  1. 什麼是”Etag”?

HTTP 協議規格說明定義ETag為“被請求變數的實體值” (參見 —— 章節 14.19)。 另一種說法是,ETag是一個可以與Web資源關聯的記號(token)。典型的Web資源可以一個Web頁,但也可能是JSON或XML文件。伺服器單 獨負責判斷記號是什麼及其含義,並在HTTP響應頭中將其傳送到客戶端,以下是伺服器端返回的格式:

ETag: “50b1c1d4f775c61:df3”

客戶端的查詢更新格式是這樣的:

If-None-Match: W/“50b1c1d4f775c61:df3”

如果ETag沒改變,則返回狀態304然後不返回,這也和Last-Modified一樣。本人測試Etag主要在斷點下載時比較有用。

Last-Modified和Etags如何幫助提高效能?
聰明的開發者會把Last-Modified 和ETags請求的http報頭一起使用,這樣可利用客戶端(例如瀏覽器)的快取。因為伺服器首先產生 Last-Modified/Etag標記,伺服器可在稍後使用它來判斷頁面是否已經被修改。本質上,客戶端通過將該記號傳回伺服器要求伺服器驗證其(客 戶端)快取。
過程如下:

  1. 客戶端請求一個頁面(A)。
  2. 伺服器返回頁面A,並在給A加上一個Last-Modified/ETag。
  3. 客戶端展現該頁面,並將頁面連同Last-Modified/ETag一起快取。
  4. 客戶再次請求頁面A,並將上次請求時伺服器返回的Last-Modified/ETag一起傳遞給伺服器。
  5. 伺服器檢查該Last-Modified或ETag,並判斷出該頁面自上次客戶端請求之後還未被修改,直接返回響應304和一個空的響應體。
    示例程式碼
    下面的例子描述如何使用伺服器端程式碼去操作客戶端快取:

Code:

複製程式碼
//預設快取的秒數
int secondsTime = 100;

//判斷最後修改時間是否在要求的時間內
//如果伺服器端的檔案沒有被修改過,則返回狀態是304,內容為空,這樣就節省了傳輸資料量。如果伺服器端的檔案被修改過,則返回和第一次請求時類似。
if (request.Headers[“If-Modified-Since”] != null && TimeSpan.FromTicks(DateTime.Now.Ticks - DateTime.Parse(request.Headers[“If-Modified-Since”]).Ticks).Seconds < secondsTime)
{
//測試程式碼,在這裡會發現,當瀏覽器返回304狀態時,下面的日期並不會輸出
Response.Write(DateTime.Now);

response.StatusCode = 304;
response.Headers.Add(“Content-Encoding”, “gzip”);
response.StatusDescription = “Not Modified”;
}
else
{
//輸出當前時間
Response.Write(DateTime.Now);

//設定客戶端快取狀態
SetClientCaching(response, DateTime.Now);
}

/**////

/// 設定客戶端快取狀態
///

/// 28 /// 29 private void SetClientCaching(HttpResponse response, DateTime lastModified)
{
response.Cache.SetETag(lastModified.Ticks.ToString());
response.Cache.SetLastModified(lastModified);
//public 以指定響應能由客戶端和共享(代理)快取進行快取。
response.Cache.SetCacheability(HttpCacheability.Public);
//是允許文件在被視為陳舊之前存在的最長絕對時間。
response.Cache.SetMaxAge(new TimeSpan(7, 0, 0, 0));
//將快取過期從絕對時間設定為可調時間
response.Cache.SetSlidingExpiration(true);
}

如果你的快取是基於檔案的方式,如XML或http中的.ashx處理,也可以使用下面的基於檔案方式的客戶端快取:

SetFileCaching
/**////

/// 基於檔案方式設定客戶端快取
///

/// 5private void SetFileCaching(HttpResponse response, string fileName)
{
response.AddFileDependency(fileName);
//基於處理程式檔案依賴項的時間戳設定 ETag HTTP 標頭。
response.Cache.SetETagFromFileDependencies();
//基於處理程式檔案依賴項的時間戳設定 Last-Modified HTTP 標頭。
response.Cache.SetLastModifiedFromFileDependencies();
response.Cache.SetCacheability(HttpCacheability.Public);
response.Cache.SetMaxAge(new TimeSpan(7, 0, 0, 0));
response.Cache.SetSlidingExpiration(true);
}
複製程式碼

結論
我們已經看了如何使用客戶端快取減少頻寬和計算的方法,如前所述,如果能正確合理的利用各種不同的快取,他們會給你帶來很多的好處.我 希望本文已為你當下或將來基於Web的專案提供了精神食糧,並正確地在底層利用Last- Modified和ETag響應頭去優化你的專案。

相關文章