Mozilla研究：瀏覽歷史非常獨特，足以可靠地識別使用者

Brewin發表於2020-09-25

原文網址 : https://learnku.com/articles/50093?order_by=created_at&

原文地址：Mozilla research: Browsing histories are unique enough to reliably identify users

線上廣告商不需要我們訪問的網站的龐大列表。我們最喜歡的網站中只有50-150個就足夠了。

最近由三名Mozilla員工發表的一項的研究關注了瀏覽歷史記錄所提供的隱私。

他們的研究結果表明，大多數使用者都有獨特的網路瀏覽習慣，使得線上廣告商能夠建立準確的個人資料。

這些配置檔案可以用來跟蹤和重新識別不同的使用者資料集中的使用者，這些資料集甚至包含使用者瀏覽歷史的小樣本。

實際上，這項研究消除了一個網路神話，即瀏覽歷史，即使是匿名的歷史，對線上廣告商也沒有用處。事實上，這項研究表明，即使是一個由50到150個使用者最喜歡和最常訪問的域名組成的小名單也能讓廣告商建立一個獨特的跟蹤檔案。

2012年的類似研究

Mozilla的研究論文名為“回答：為什麼我們仍然不能在和平中瀏覽：論網路瀏覽歷史的唯一性和可再識別性”[PDF]。

這篇論文在本月早些時候的USENIX安全會議上發表，是2012年發表的另一項學術研究的後續。

這項研究是當時分析使用者隱私的最大專案之一，也是研究團隊的一項重大任務，該研究團隊收集了38萬多名網際網路使用者的瀏覽器歷史資料。

在2009年1月到2011年5月期間，研究人員讓使用者訪問一個線上測試站點，在那裡他們使用一些聰明的CSS程式碼來確定使用者訪問過的預定義列表中的哪些網站。

2012年的研究發現，97%的訪問過這個測試站點的使用者在他們的瀏覽歷史中有一個唯一的站點列表，這使得瀏覽器歷史成為一個可靠的使用者指紋識別載體。

此外，當要求使用者再次訪問測試站點時，研究人員表示，他們能夠根據第一次訪問時的瀏覽歷史記錄重新識別使用者。

當研究人員檢視50個使用者最流行的域名的瀏覽歷史資料集時，準確率為38%，當他們分析500個域名的資料集時，準確率為70%。

Mozilla 2020論文

但去年，Mozilla的研究人員希望重新評估瀏覽歷史是否仍然是有效的指紋識別載體，以及2012年的研究是否仍然成立。

這項新實驗於2019年7月16日至8月13日期間進行，當時Mozilla鼓勵Firefox使用者參與這項實驗。

Mozilla的研究人員表示，超過52000名使用者同意參與，並同意提供匿名瀏覽資料。

然而，這一次，由於資料是從Firefox本身收集的，而不是透過執行長時間CSS測試的網頁收集的，因此資料更加準確可靠。此外，Mozilla研究人員收集的資料也與當今線上分析公司收集的關於使用者的資料型別相同，無論是透過資料合作伙伴關係、移動應用程式、線上廣告或其他機制。

與之前一樣，資料收集分兩個階段進行，在兩週內，使用者在第一週共享瀏覽歷史，然後在第二週再次共享，這樣Mozilla的研究人員就可以重新識別使用者了。

Mozilla團隊表示，他們總共收集了660000個獨立域的3500萬個網站訪問量資料。這項研究的發現立即反映了對更高質量資料的獲取。

Mozilla說，他們為這項研究收集的99%的瀏覽資料對每個使用者都是獨一無二的。
這種獨特性使得Mozilla的研究人員在研究的第二週很容易重新識別使用者。

準確性也優於2012年的研究，Mozilla聲稱，對於包含使用者瀏覽歷史的50個域的資料集，其可重新識別率接近50%。當Mozilla的研究人員將瀏覽歷史資料集擴充套件到150個域時，重新識別率增長到了80%以上。

後一項發現表明，分析公司和線上廣告商不需要龐大的瀏覽歷史資料列表來跟蹤使用者，而且每個使用者的瀏覽癖好和他們最喜歡的網站最終都會洩露出去，即使資料是匿名的，網址也會被截斷以刪除使用者名稱，只留下核心域名。

Mozilla團隊的演示影片在這裡提供。

本作品採用《CC 協議》，轉載必須註明作者和本文連結

14.3 瀏覽歷史
2019-08-05
【譯】瀏覽器user-agent的歷史
2018-10-17
瀏覽器
【工具】火狐瀏覽器歷史版本下載
2018-04-18
瀏覽器
使用 JavaScript 操作瀏覽器歷史記錄 API
2020-11-19
JavaScript瀏覽器API
為什麼瀏覽器的使用者代理字串以 Mozilla 開頭
2018-03-06
瀏覽器字串
ATRESplayer PREMIUM攜手華為提升使用者體驗，突破瀏覽量歷史記錄
2021-07-30
REM
Mac上的Safari瀏覽器如何檢視歷史記錄？
2022-04-08
Mac瀏覽器
history.pushState() 給網站新增和修改瀏覽歷史記錄
2018-10-01
網站
selenium 啟動 chrome 瀏覽器非常慢。
2024-07-11
Chrome瀏覽器
win10瀏覽器檢視歷史紀錄卡死恢復方法
2020-07-09
Win10瀏覽器
Entity Framework版本歷史概覽
2018-05-29
Framework
瀏覽器中的手寫數字識別
2019-04-25
瀏覽器
瀏覽器 UA 的變遷史
2022-07-09
瀏覽器
操縱瀏覽器歷史記錄 : popstate() 、 history.pushState() 、 window.history.pushState（）
2018-11-19
瀏覽器
[求助]如何讓pc瀏覽器和手機瀏覽器自動識別並跳轉
2019-05-11
瀏覽器
前端發展史及瀏覽器核心
2020-11-25
前端瀏覽器
一張圖看懂影象識別演算法發展歷史
2019-08-22
演算法
推薦一個 Chrome 瀏覽歷史記錄管理的擴充套件 - History Trends Unlimited
2021-12-13
Chrome套件MIT
Mozilla 宣佈：火狐瀏覽器將在年底前全面支援 MV3
2022-05-29
瀏覽器
分享一套非常特別的海報作品
2021-08-08
關於直播視訊格式和瀏覽器相容性歷史的來龍去脈
2019-01-15
瀏覽器
安全麻煩不斷Mozilla再次推遲火狐瀏覽器3.1版釋出
2019-05-13
瀏覽器
駭客線上出售 4 億 Twitter 使用者資料；Mozilla 修復了 18 年的歷史 bug｜思否週刊
2023-01-01
我認識Linux的小羞愧歷史
2021-03-18
Linux
小文：淺談瀏覽器發展簡史
2018-11-21
瀏覽器
微軟稱win10十月更新上的新版Edge是歷史最佳瀏覽器
2018-10-09
微軟Win10瀏覽器
Google 搜尋決定停止支援 IE11，IE 瀏覽器或將退出歷史舞臺？
2021-10-07
GoIE11瀏覽器
中文電子病歷命名實體識別（CNER）研究進展
2021-01-29
關於Mozilla崩潰的研究
2024-08-14
瀏覽器知識點總結
2018-05-04
瀏覽器
別再讓你的web頁面在使用者瀏覽器端裸奔
2018-04-11
Web瀏覽器
jQuery判斷瀏覽器型別
2018-07-14
jQuery瀏覽器型別
不同瀏覽器核心的區別
2019-10-10
瀏覽器
特別的愛給特別的你，獨家課預售即將開啟
2020-11-10
文字識別（二）--字元識別技術總覽
2019-02-18
字元
win10中的瀏覽器開啟網速特別慢是怎麼回事_win10瀏覽器開啟慢如何處理
2020-04-23
Win10瀏覽器
Mozilla，火狐瀏覽器背後神祕又偉大的開源組織｜Open Source Prism
2021-09-26
瀏覽器
face-api.js：在瀏覽器中進行人臉識別的JS介面
2018-07-17
APIJS瀏覽器

Mozilla研究：瀏覽歷史非常獨特，足以可靠地識別使用者

2012年的類似研究

Mozilla 2020論文

相關文章