理解 cookie、session、token

A_aliane發表於2019-06-19
  • 1、很久以前,Web 基本上就是文件的瀏覽而已, 既然是瀏覽,作為伺服器, 不需要記錄誰在某一段時間裡都瀏覽了什麼文件,每次請求都是一個新的 HTTP 協議, 就是請求加響應, 尤其是我不用記住是誰剛剛發了 HTTP 請求, 每個請求對我來說都是全新的。
  • 2、但是隨著互動式 Web 應用的興起,像線上購物網站,需要登入的網站等等,馬上就面臨一個問題,那就是要管理會話,必須記住哪些人登入系統, 哪些人往自己的購物車中放商品, 也就是說我必須把每個人區分開,這就是一個不小的挑戰,因為HTTP請求是無狀態的,所以想出的辦法就是給大家發一個會話標識 session id, 說白了就是一個隨機的字串,每個人收到的都不一樣, 每次大家向我發起HTTP請求的時候,把這個字串給一併捎過來, 這樣我就能區分開誰是誰了
  • 3、這樣大家很嗨皮了,可是伺服器就不嗨皮了,每個人只需要儲存自己的 session id,而伺服器要儲存所有人的 session id !如果訪問伺服器多了, 就得由成千上萬,甚至幾十萬個。

    這對伺服器說是一個巨大的開銷 , 嚴重的限制了伺服器擴充套件能力, 比如說我用兩個機器組成了一個叢集, 小F通過機器A登入了系統, 那session id會儲存在機器A上, 假設小F的下一次請求被轉發到機器B怎麼辦?機器B可沒有小F的 session id啊。有時候會採用一點小伎倆:session sticky , 就是讓小F的請求一直粘連在機器A上, 但是這也不管用, 要是機器A掛掉了, 還得轉到機器B去。那隻好做 session 的複製了, 把session id 在兩個機器之間搬來搬去, 快累死了。

理解 cookie、session、token

後來有個叫 Memcached的支了招:把session id集中儲存到一個地方, 所有的機器都來訪問這個地方的資料, 這樣一來,就不用複製了, 但是增加了單點失敗的可能性, 要是那個負責session 的機器掛了, 所有人都得重新登入一遍, 估計得被人罵死。
理解 cookie、session、token
也嘗試把這個單點的機器也搞出叢集,增加可靠性, 但不管如何, 這小小的session 對我來說是一個沉重的負擔

  • 4、於是有人就一直在思考, 我為什麼要儲存這可惡的session呢, 只讓每個客戶端去儲存該多好?

可是如果不儲存這些session id, 怎麼驗證客戶端發給我的session id 的確是我生成的呢?** 如果不去驗證,我們都不知道他們是不是合法登入的使用者, 那些不懷好意的傢伙們就可以偽造session id , 為所欲為了。

嗯,對了,關鍵點就是驗證 !

比如說, 小F已經登入了系統, 我給他發一個令牌token, 裡邊包含了小F的 user id, 下一次小F 再次通過Http請求訪問我的時候, 把這個token 通過Http header帶過來不就可以了。*

不過這和session id沒有本質區別啊, 任何人都可以可以偽造, 所以我得想點兒辦法, 讓別人偽造不了。

那就對資料做一個簽名吧, 比如說我用HMAC-SHA256 演算法,加上一個只有我才知道的金鑰, 對資料做一個簽名, 把這個簽名和資料一起作為token, 由於金鑰別人不知道, 就無法偽造token了。
理解 cookie、session、token

這個 token 我不儲存, 當小F把這個 token 給我發過來的時候,我再用同樣的 HMAC-SHA256 演算法和同樣的金鑰,對資料再計算一次簽名, 和 token 中的簽名做個比較, 如果相同, 我就知道小F已經登入過了,並且可以直接取到小F的user id , 如果不相同, 資料部分肯定被人篡改過, 我就告訴傳送者:對不起,沒有認證。
理解 cookie、session、token

Token 中的資料是明文儲存的(雖然我會用Base64做下編碼, 但那不是加密), 還是可以被別人看到的, 所以我不能在其中儲存像密碼這樣的敏感資訊。

當然, 如果一個人的token 被別人偷走了, 那我也沒辦法, 我也會認為小偷就是合法使用者, 這其實和一個人的session id 被別人偷走是一樣的。

這樣一來, 我就不儲存session id 了, 我只是生成token , 然後驗證token , 我用我的CPU計算時間獲取了我的session 儲存空間 !

解除了session id這個負擔, 可以說是無事一身輕, 我的機器叢集現在可以輕鬆地做水平擴充套件, 使用者訪問量增大, 直接加機器就行。這種無狀態的感覺實在是太好了!

  • cookie 是一個非常具體的東西,指的就是瀏覽器裡面能永久儲存的一種資料,僅僅是瀏覽器實現的一種資料儲存功能。
  • cookie 由伺服器生成,傳送給瀏覽器,瀏覽器把 cookie 以 kv 形式儲存到某個目錄下的文字檔案內,下一次請求同一網站時會把該 cookie 傳送給伺服器。由於 cookie 是存在客戶端上的,所以瀏覽器加入了一些限制確保 cookie 不會被惡意使用,同時不會佔據太多磁碟空間,所以每個域的 cookie 數量是有限的。
  • session 從字面上講,就是會話。這個就類似於你和一個人交談,你怎麼知道當前和你交談的是張三而不是李四呢?對方肯定有某種特徵(長相等)表明他就是張三。
  • session 也是類似的道理,伺服器要知道當前發請求給自己的是誰。為了做這種區分,伺服器就要給每個客戶端分配不同的“身份標識”,然後客戶端每次向伺服器發請求的時候,都帶上這個“身份標識”,伺服器就知道這個請求來自於誰了。至於客戶端怎麼儲存這個“身份標識”,可以有很多種方式,對於瀏覽器客戶端,大家都預設採用 cookie 的方式。
  • 伺服器使用 session 把使用者的資訊臨時儲存在了伺服器上,使用者離開網站後 session 會被銷燬。這種使用者資訊儲存方式相對 cookie 來說更安全,可是 session 有一個缺陷:如果 web 伺服器做了負載均衡,那麼下一個操作請求到了另一臺伺服器的時候 session 會丟失。
  • 在 Web 領域基於 Token 的身份驗證隨處可見。在大多數使用 Web API 的網際網路公司中,tokens 是多使用者下處理認證的最佳方式。
  • 以下幾點特性會讓你在程式中使用基於 Token 的身份驗證
    1. 無狀態、可擴充套件
    2. 支援移動裝置
    3. 跨程式呼叫
    4. 安全
  • 那些使用基於 Token 的身份驗證的大佬們
  • 大部分你見到過的 API 和 Web 應用都使用 tokens。例如 Facebook , Twitter , Google+ , GitHub 等。

起源

基於伺服器的驗證

  • 我們都是知道 HTTP 協議是無狀態的,這種無狀態意味著程式需要驗證每一次請求,從而辨別客戶端的身份。
  • 在這之前,程式都是通過在服務端儲存的登入資訊來辨別請求的。這種方式一般都是通過儲存 Session 來完成。
  • 隨著 Web ,應用程式,已經移動端的興起,這種驗證的方式逐漸暴露出了問題。尤其是在可擴充套件性方面。

基於伺服器驗證方式暴露的一些問題

  • Seesion:每次認證使用者發起請求時,伺服器需要去建立一個記錄來儲存資訊。當越來越多的使用者發請求時,記憶體的開銷也會不斷增加。
  • 可擴充套件性:在服務端的記憶體中使用Seesion儲存登入資訊,伴隨而來的是可擴充套件性問題。
  • CORS (跨域資源共享):當我們需要讓資料跨多臺移動裝置上使用時,跨域資源的共享會是一個讓人頭疼的問題。在使用 Ajax 抓取另一個域的資源,就可以會出現禁止請求的情況。
  • CSR F(跨站請求偽造):使用者在訪問銀行網站時,他們很容易受到跨站請求偽造的攻擊,並且能夠被利用其訪問其他的網站。

在這些問題中,可擴充套件行是最突出的。因此我們有必要去尋求一種更有行之有效的方法。

基於Token的驗證原理

基於Token的身份驗證是無狀態的,我們不將使用者資訊存在伺服器或Session中。

這種概念解決了在服務端儲存資訊時的許多問題

NoSession意味著你的程式可以根據需要去增減機器,而不用去擔心使用者是否登入。

基於 Token 的身份驗證的過程如下:

  1. 使用者通過使用者名稱和密碼傳送請求。
  2. 程式驗證。
  3. 程式返回一個簽名的token 給客戶端。
  4. 客戶端儲存token,並且每次用於每次傳送請求。
  5. 服務端驗證token並返回資料。

每一次請求都需要 tokentoken 應該在HTTP的頭部傳送從而保證了Http請求無狀態。我們同樣通過設定伺服器屬性Access-Control-Allow-Origin:* ,讓伺服器能接受到來自所有域的請求。

需要主要的是,在 ACAO 頭部標明 (designating)* 時,不得帶有像 HTTP 認證,客戶端 SSL 證照和 cookies 的證照

實現思路:

理解 cookie、session、token

  1. 使用者登入校驗,校驗成功後就返回Token給客戶端。
  2. 客戶端收到資料後儲存在客戶端
  3. 客戶端每次訪問 API 是攜帶Token到伺服器端。
  4. 伺服器端採用 filter 過濾器校驗。校驗成功則返回請求資料,校驗失敗則返回錯誤碼

當我們在程式中認證了資訊並取得token之後,我們便能通過這個Token做許多的事情。

我們甚至能基於建立一個基於許可權的token傳給第三方應用程式,這些第三方程式能夠獲取到我們的資料(當然只有在我們允許的特定的token

Tokens的優勢

無狀態、可擴充套件

  • 在客戶端儲存的 Tokens 是無狀態的,並且能夠被擴充套件。基於這種無狀態和不儲存 Session 資訊,負載負載均衡器能夠將使用者資訊從一個服務傳到其他伺服器上。
  • 如果我們將已驗證的使用者的資訊儲存在 Session 中,則每次請求都需要使用者向已驗證的伺服器傳送驗證資訊(稱為 Session 親和性)。使用者量大時,可能會造成一些擁堵。
  • 但是不要著急。使用 tokens 之後這些問題都迎刃而解,因為 tokens 自己 hold 住了使用者的驗證資訊。

安全性

  • 請求中傳送 token 而不再是傳送 cookie 能夠防止 CSRF (跨站請求偽造)。即使在客戶端使用 cookie 儲存 tokencookie 也僅僅是一個儲存機制而不是用於認證。不將資訊儲存在 Session 中,讓我們少了對 session 操作。
  • token 是有時效的,一段時間之後使用者需要重新驗證。我們也不一定需要等到 token 自動失效,token 有撤回的操作,通過 token revocataion可以使一個特定的 token 或是一組有相同認證的 token 無效。

可擴充套件性

  • Tokens 能夠建立與其它程式共享許可權的程式。例如,能將一個隨便的社交帳號和自己的大號 (Fackbook或是Twitter) 聯絡起來。當通過服務登入 Twitter (我們將這個過程Buffer)時,我們可以將這些 Buffer 附到 Twitter 的資料流上 (we are allowing Buffer to post to our Twitter stream)。
  • 使用tokens時,可以提供可選的許可權給第三方應用程式。當使用者想讓另一個應用程式訪問它們的資料,我們可以通過建立自己的 API,得出特殊許可權的tokens

多平臺跨域

我們提前先來談論一下 CORS (跨域資源共享),對應用程式和服務進行擴充套件的時候,需要介入各種各種的裝置和應用程式。

Having our API just serve data, we can also make the design choice to serve assets from a CDN. This eliminates the issues that CORS brings up after we set a quick header configuration for our application.

只要使用者有一個通過了驗證的token,資料和資源就能夠在任何域上被請求到。

Access-Control-Allow-Origin: *      
  • 基於標準建立 token 的時候,你可以設定一些選項。標準的用法在JSON Web Tokens體現。
  • 最近的程式和文件是供給JSON Web Tokens的。它支援眾多的語言。這意味在未來的使用中你可以真正的轉換你的認證機制。

轉自:微信公眾號: 民工哥技術之路

相關文章