網站是如何「看到」使用者的:獨立IP與cookie和Session

天府雲創發表於2017-12-11

使用者在訪問網站的時候,如何通過技術手段識別每一個使用者?

不知道大家在訪問網站的時候,會不會疑惑為什麼我的所有資訊都會被網站“看到”呢?比如說我上網的地理位置、點選了哪個頁面、在網站停留了多長時間、花了多少錢等等。

其實我們的所有操作都會被網站“看到”,也就是被統計起來;網站統計之後的資料就是大家常常聽到的 UV、PV、Session 等等之類的網路術語(之後我會展開闡述各個概念)。

但是作為一名求知慾旺盛的少年,怎麼能止步於 What 層面,我們還要知道 Why and How。

網站是如何看到使用者的問題,其實專業來講,是使用者識別的問題。接下來,我們一一來展開分析:

一般而言,我們會使用 MAC Address、IP、Cookie、User Agent、Mobile Number、User ID、SIM ID、Email 作為識別使用者身份的手段。這些方法都有各自的優劣,比如,移動端常用 Mobile Number、SIM ID 等來識別使用者,網站常用 Cookie 來識別使用者。而在此,我們也關注 IP 和 Cookie,重點闡述下兩者的概念和優劣。

因此,特將常用網站資料分析方面的概念整理出來,分享給大家。

IP,Internet Protocol,獨立IP

IP 為計算機網路相互連線進行通訊而設計的協議,是連線到網上的所有計算機網路實現相互通訊的一套規則,我們每臺可以上網的電腦都有一個 IP,且在全世界範圍內是唯一的。因此 IP 的唯一性被用來作為網站表現的一個指標。

插播插播:在向具體說明IP和Cookie的使用之前,先向大家介紹一個實用的工具 GA,知道 GA 是什麼的小夥伴兒可以直接略過這段了。

GA,即 Google Analytics,是 Google 提供的一個統計網站、App 等網際網路產品資料的資料分析工具,可以對使用者的年齡、性別、地理位置,PV、UV、訪問時長、訪問頁面、跳出率、等指標進行統計,對分析網站或是 App 有很好的幫助作用。

如果還是比較抽象的話,可以理解成國外的百度統計——當然百度統計要比 GA 開發的晚得多了。

之前做過網站站長或是App運營的人可能使用過這個工具,但由於 Google 如今退出中國,可能有很多小夥伴兒們不太清楚 GA 是什麼,因此插播此段。

GA 不使用 IP 地址來識別訪問者的身份,但是會追蹤每個訪問者的 IP 地址資訊,且整個追蹤過程是在 Google 伺服器端完成的,不會在 GA 的返回資料中看到。

那麼 GA 統計 IP 地址的意義僅是用來識別訪問者的地理位置資訊。這個地理位置資訊會以地圖的方式展現給我們,告訴我們使用者活躍的大致位置。

Cookie,瀏覽器快取

Cookie refers to an HTTP cookie, which is a small piece of data sent from a website and stored on the user’s computer by the user’s web browser

while the user is browsing. At the same time, it also called a web cookie, Internet cookie, browser cookie, or simply cookie.

網站為了辨別使用者身份,追蹤 session 等資料跟蹤而預先儲存在使用者本地終端上的通常經過加密的資料。Cookie 是網站以一小段文字的形式存放在使用者本地終端的資訊,以便網站之後的讀取,基本能夠唯一對應到使用者的訪問終端,但要預先寫入訪問終端,同時還是在使用者允許使用 Cookie 的前提下。

聽起來 Cookie 也有劣勢,那為什麼我們要放棄使用 IP 的統計而轉向使用 cookie 的方式呢?

當使用者使用客戶端第一次訪問某個網站伺服器時,比如 Baidu.com,那麼 Baidu.con 的網站伺服器就會預先寫入一段 Cookie 到客戶端上。GA 通過隨機數和時間戳來生成字串來唯一標識使用者,且還會記錄一些訪問資訊,比如訪問的頁面、訪問的時間等,而當我們再次訪問 Baidu.com 的時候,伺服器會直接找到 Cookie 資訊,更新一些訪問資訊,但是並不會更改唯一表示的使用者資訊。

之後也會使用 Cookie 對使用者的 session、UV、PV 等數均進行統計,也就是生成了大家平日裡常見的資料指標了。顯而易見,Cookie 比 IP 更準確,這也就是為什麼網站現在都使用 Cookie 來識別使用者了。

那麼問題來了,網站是如何通過 Cookie 來識別使用者身份的呢?請聽下回分解!@

相關文章