推薦那麼準，除了模型，還有什麼。。。

正版喬發表於2021-01-17

原文網址 : https://www.cnblogs.com/qiaohaoforever/p/14289947.html

最近v2ex論壇上出現一篇很熱門的帖子《QQ正在嘗試讀取你的瀏覽記錄》，題目很聳動，結果也很令人吃驚。

簡要介紹一下事情的來龍去脈，樓主反映火絨防毒軟體提示QQ正在觸發一些規則，QQ嘗試讀取使用者的AppData\Local\Google\Chrome\User Data\Default\History等目錄，目錄中的資訊為使用者瀏覽器歷史記錄。有點東西，隨後看雪平臺的安全大佬對行為進行了逆向分析（[原創]關於QQ讀取Chrome歷史記錄的澄清），其先讀取各種 User Data\Default\History 檔案，讀到了就複製到Temp目錄下的temphis.db。然後再用SQLite讀取資料庫，然後“select url from urls”，獲取到使用者的歷史資訊域名，至於獲取這些域名資訊後面的操作已經可以猜到了！

結論，QQ並不是特意讀取Chrome的歷史記錄的，而是會試圖讀取電腦裡所有谷歌系瀏覽器的歷史記錄並提取連結，確認會中招的瀏覽器包括但不限於Chrome、Chromium、360極速、360安全、獵豹、2345等瀏覽器。

大部分的瀏覽器都會中招，QQ就這麼輕而易舉地扒掉了瀏覽器的“底褲”。

對於後面的結果我不太驚訝，我吃驚於為何手段如此簡單。

過去經常有人發出“手機竊聽說話、聊天資訊導致app推薦如此之準”的疑惑，作為一名演算法工程師，我對於推薦的精準一點都不意外，因為基於使用者的大量瀏覽記錄、留存於app上的基礎資訊和目前所在環境資訊，這些大量的使用者資訊在模型的“召回-》精排-》粗排”過後給使用者推薦出感興趣的音樂、視訊、新聞並不是一件什麼困難的事情。

但是，資料的獲取細節，我們可能也不太瞭解。對於資料來源，我以前的猜想是使用者在app上的點選埋點資訊以及集團下面的兄弟企業間的資訊共享就可以達到我在百度搜尋了團建遊戲，微信朋友圈就有望京小腰的廣告推薦。

只要友商夠多，收購的小弟們夠多，這種做法理論上是行得通的，也是有效的。但是這種模式相當受限，想讓百度、阿里、騰訊進行這種準實時的資料合作相當之難。而且，在技術層面想達到服務間的資料及時共享也得耗費大量人力財力。

直接扒瀏覽器資料夾，相較於我的猜想可謂是神之一手，不用商務去對接“友商”，不用產品去互啃對方文件，不用技術加班996，只用把資料夾複製一份就搞定，妙！

不過，目前的一些資訊也只是兩位熱心市民的自助探索，到底騰訊對這一步技術操作如何解釋，我也相當好奇（吃瓜

最後，提醒各位一句，網際網路上無隱私，保護好自己，你偷偷看的東西，還有一群人在幫你分析=。=

插圖來源：帆咔嚓@FanKetchup

微信公眾號：正版喬

除了臭豆腐，你還知道長沙有什麼？
2021-08-23
除了SmartGit，還有哪些Git客戶端工具推薦
2024-02-01
Git客戶端
除了敲程式碼，你還有什麼副業嗎？
2018-04-16
除了 filter 還有什麼置灰網站的方式？
2022-12-02
Filter網站
學Java有什麼技巧和方法推薦？
2021-09-30
Java
有沒有什麼管理類的書可以推薦？
2024-06-19
除了teamviewer，還有什麼遠端控制伺服器的工具？
2020-07-02
View伺服器
除了星外，還有什麼公有云管理系統比較好？
2020-01-09
斬獲TGA大獎的《GRIS》，除了顏值高，還有什麼？
2019-12-19
CTO關注：升級Win10，除了更安全還有什麼
2018-03-28
Win10
2019 我們除了Android還可以學什麼？
2019-02-21
Android
為什麼有那麼多人選擇“人工智慧”，真的有那麼好嗎？
2018-09-10
人工智慧
除了寶塔，還有什麼好用的伺服器管理皮膚工具？
2019-12-26
伺服器
豐田除了精益生產，還有什麼值得我們學習?
2022-06-08
什麼Jupyter框架?為什麼學Python推薦Jupyter?
2021-01-22
框架Python
2020年了，為什麼IT行業還那麼“吃香”？
2020-10-29
行業
開始學go，有推薦什麼書籍的嗎？
2020-12-07
Go
洛基山脈的森林中除了孤獨還有什麼？——聊聊《看火人》
2019-12-18
除了影片分析，人工智慧和機器學習還有什麼好處？
2020-08-11
人工智慧機器學習
AI技術之於製造業，除了提升生產效率還有什麼？
2020-10-20
AI
我為什麼不再推薦RxJava
2019-05-06
RxJava
Python那麼火，我只推薦這兩本書
2018-10-09
Python
覆盤阿里雲故障，除了罵，還能做些什麼？
2019-03-22
阿里
除了用於銷售還能做什麼，CRM系統？
2022-04-01
什麼？修改 JSON 內容居然還有個 JSON PATCH 標準
2023-04-10
JSON
【BERT】你儲存的BERT模型為什麼那麼大？
2020-03-13
模型
react router為什麼推薦使用browserHistory而不推薦hashHistory？
2020-04-05
React
有什麼比較好用的遠端軟體值得推薦？
2020-02-21
想在 Docker 上搭建 Laravel，有什麼相關文章可以推薦
2020-08-14
DockerLaravel
開箱即用的模型叫什麼模型？有什麼特點
2024-04-15
模型
CSS 很容易，那為什麼大家還是把 CSS 寫的那麼爛呢？
2019-04-17
CSS
YouTube視訊推薦系統為什麼那麼強？看了這篇文章你就知道了
2019-10-17
RFM是什麼？這個模型有什麼用？
2022-12-21
模型
除了前端以外還了解什麼其它技術麼？你自己最最厲害的技能是什麼？
2024-11-29
前端
Linux是什麼?為什麼推薦學習Linux技術？
2021-07-30
Linux
什麼Jupyter?為什麼初學Python推薦選擇Jupyter?
2020-12-09
Python
除了find命令，還有這麼多檔案查詢命令！
2020-06-29
除了直播點播IPTV系統還有這麼多功能？
2021-06-24

推薦那麼準，除了模型，還有什麼。。。

相關文章