頭條的演算法推薦,並不神祕!

AIBigbull2050發表於2019-12-11


2019-04-11 21:09:55


頭條的演算法推薦,並不神祕!



文|靠譜的阿星


大資料時代,使用者對於個人隱私無處安放表現出極度的不安全感,近年來315曝光的一些使用者隱私洩露、甚至公民資訊被非法販賣的事件,可謂觸目驚心!而每年兩會採納的相應使用者隱私保護提案,也正逐漸完善相應的法律保護邊界。

內容推薦引擎、個性化定製千人千面自從今日頭條大放光彩之後,開始被很多知名APP所採納。不過,使用者與資訊流平臺之間的關係有些微妙,一些使用者既享受到了App通過資料收集帶來的便利,也擔心過於精準化的推薦所帶來的“煩惱”。

3月下旬,網上出現一些對餓了麼、美團外賣等餐飲O2O平臺通過錄音許可權竊聽使用者隱私的質疑,餓了麼、美團官方均予以否認,並認為利用錄音提取關鍵詞進行本地商品服務推薦是一種“無端的猜測”,況且相應的技術條件還達不到。

幾乎在同時,今日頭條在類似的質疑和謠言中並未倖免,大致的描述通常是這樣的,“我和我朋友昨天在談論xx,第二天頭條就向我推薦了xxx”;“我在某某App剛看過xxx,第二天頭條就向我推薦了xxx”等等,一些使用者也帶入到是否頭條也通過錄音竊聽使用者隱私的“自證預言”之中。儘管頭條官方闢謠,由於今日頭條在內容興趣推薦精準度方面逐漸提升,類似使用者的“猜測”並沒有釋然。

本質上是很多使用者對演算法不瞭解,從不瞭解到恐懼,甚至產生了一種“迷信”態度,誤以為內容推薦引擎是一種“讀心術”,可以知曉人很多隱私。事實上,從頭條、快手的崛起可以看出,興趣引擎(機器主動精準推薦)已經開始逐漸取代搜尋引擎(人發起需求精準找),成為新的底層技術架構,在未來二者之間的融合也會成為資訊分發平臺的主流,這也是目前百度App、今日頭條從不同擅長領域進取的方向。如果懂得人不講,不懂的人瞎說,以訛傳訛只會加深了對新技術的誤解。


一、對使用者隱私的獲取邊界,是演算法的許可權


推薦引擎與搜尋引擎的區別在於前者是系統給使用者推薦,而後者是使用者主動發起尋求;所以,推薦引擎在啟動期時候需要放在內容池中測試使用者的興趣,再基於使用者上網的行為資料進行定製化推薦,顯然更依賴使用者上網所產生的資料。

關於這一點,今日頭條在《隱私政策》中並沒有否認:

第(1)條即為“為了保障產品的正常執行,實現個性化推薦、釋出資訊、互動交流、搜尋查詢等核心功能以及其他功能,我們會收集你的部分必要資訊。”

第(2)條中提到了收集的是使用者的哪些資訊,“在你進行註冊認證、釋出資訊、互動交流或使用基於地理位置的服務時,基於法律要求或實現功能所必需,我們可能會收集姓名、聯絡方式、通訊錄、圖文、音視訊檔案、地理位置等個人資訊。”

根據網路評論實名制的要求,上述條款在如何一款資訊類App之中幾乎都是一樣,而所收集的“音視訊檔案”與“圖文”是已釋出的資訊,並且是基於法律要求或實現功能所必需才進行收集,在第(5)條又重申“我們將努力採用合理的安全措施來保護你的個人資訊。特別的,我們講採用行業內通行的方式以盡最大的商業努力來保護你個人敏感資訊的安全。”


頭條的演算法推薦,並不神祕!

(圖片來自頭條隱私政策)


如果把頭條的推薦引擎比作一臺人工智慧(AI)機器,人工智慧的特點“比你更懂你自己,幫你幹活還不累”,應用在資訊分發領域,要實現智慧推薦,須有足夠豐富的使用者大資料作為演算法的訓練場景,這些資料的源頭活水即使用者“關注、收藏、搜尋、瀏覽偏好等”等上網使用行為資料,作為個性化推薦的“燃料”;並且AI還能根據“反饋、釋出、點贊、評論等使用者主動發起的行為以及明確授權同意開啟的地理位置資訊”來動態調整演算法推薦,因而說到底,演算法的推薦也是“後置的”分析處理,並沒有“先知”窺探能力。


對於通過“錄音竊聽使用者隱私”的擔憂,筆者發現條款裡是這樣寫的,“你使用上傳圖片、釋出音視訊功能時,我們會請求你授權相機、照片、麥克風等敏感許可權”;就跟使用微信不開啟麥克風無法傳送語音訊息、使用滴滴沒有授權使用者地理位置無法叫車是一個道理,開啟麥克風這一“敏感許可權”只會在上傳音視訊時才會主動由使用者開啟,而所謂的“竊聽”則是在使用者不知情的情況下後臺開啟並用於不正當用途。


頭條的演算法推薦,並不神祕!



至於App開啟使用者麥克風進行錄音竊聽,需要遠端操控使用者手機,一般是黑客在使用者手機先放病毒安裝包,市面上的手機系統和病毒軟體把這樣的安全漏洞也早就被解決了。即使是App通過麥克風錄音要綜合考慮語速大小、音量大小、環境音大小、語音清晰度以及地域口音等因素,其語音識別準確率非常有限、商業使用者價值不大,遠遠不如通過使用者上網行為資料進行推薦來得直接有效。


演算法推薦除了使用者個性化資訊push外,還應用在廣告精準推送和營銷上,這構成了目前資訊流產品的主要商業模式。


二、從微頭條、抖音推薦內容中管窺社交在演算法機制中作用


頭條系產品的形態不一樣,但是底層技術是一致的,尤其是基於使用者上網行為分析出興趣圖譜推薦潛在感興趣或有用資訊的引擎是一樣的。

頭條產品在2017年4月份上線微頭條之後,頭條系統推薦內容的確更加精準化了,此前很多媒體人罵頭條內容low,現在基本上是聽不到了。

主要原因一方面,頭條的流量上漲吸引了很多優質原創作者,導致其內容生態整體質量上有提升;另一方面是引入微頭條等社交關係鏈之後,系統在啟動期不需要釋放不同型別、關鍵字領域的內容來測試讀者的興趣點,而是會參考互動頻次最高的網友,已篩選或相關領域的內容推送給關係鏈上的使用者,通過社交緊密程度輔助內容個性化推薦的準確率。

如果使用者有兩臺手機分別不同的頭條賬戶就會發現,“在微頭條中互動的頻次比較高,並且會直接影響到系統內容推薦,而系統推薦的一些大V,往往也是好友所關注的,這加速了一些大V吸粉的效率。”一位關注阿星微頭條、並且經常互動的好友向我反饋,“頭條不只是完全的資訊‘流’,很注重粉絲的留存。”


頭條的演算法推薦,並不神祕!

(第一張圖和第二張圖是新手機頭條賬戶;第三張圖是我經常使用頭條號頁面,相關度很高)


社交關係鏈的引入對頭條內容進化來說是一次“蝶變”,以往頭條的推薦只需要根據使用者本身上網資料進行興趣推薦;引入到社交因素之後,除了根據機器預設使用者興趣偏好以外,還會把好友已經看過的西瓜視訊、小視訊、悟空問答等推薦給新使用者,從而大大產品的使用粘性。


類似的作用機制與微信公眾號中好友通過點贊“在看”篩選優質內容如出一轍,不過,以社交推薦內容的方式在頭條相對隱蔽,也更為資料化。


同樣的機制也會出現在抖音的流量推薦之中,第一步是機器測試、積累資料後識別使用者的興趣愛好;第二步開始引入互動高頻的抖音好友完播、點贊、評論的內容,從而讓使用者在刷抖音時獲得沉浸式體驗。


在第一階段的抖音,機器會更換美女、帥哥、美景、搞笑、萌娃、寵物、才藝、技能、情感、乾貨等不同型別進行測試,在興趣標籤相對寬泛時,資訊流推薦容易出現審美疲勞,並導致火爆的視訊創意演變為套路化的程式。


而在引入社交相關度個性化推薦之後,使用者刷到的下一個短視訊,推薦權重最高的是,很多概率會是抖音上互關的好友點贊過短視訊,會做優先呈現;如果你關注的好友很少,這種體會將更加明顯,機器預設為好友感興趣的視訊你也會喜歡。這一點上看,抖音進行流量推薦也並非神祕莫測。


「假如你有兩個抖音賬戶,你會發現抖音推薦的小祕密 ,那就是會直接推薦關係鏈上(互關的、互動高頻的朋友)看過的視訊,比如在另一個手機上點的視訊,會推薦到另一賬戶之上,要是找不到此前看過短視訊,只要在另一臺手機上一直往下刷,一定可以刷到!另外,西瓜視訊的推薦也是如此,這讓我找到了自己喜歡刷西瓜視訊的原因,因為機器預設我的朋友大體上和我的欣賞趣味是一致的,所有看起來厲害的演算法推薦,其實也是有社交的。」


我曾把這個微頭條徵求其他好友確認,發現這並非個別情況:


頭條的演算法推薦,並不神祕!

(同時兩臺不同手機登陸不同的賬戶刷抖音,重合率非常高並非偶然現象)


在微頭條、抖音之中都有一個特點是,每一條更新內容的流量與粉絲量的大小並無強關聯,頭條的演算法推薦擺脫了自媒體對私慾流量的依賴,只要是優質的、並且有高強度的互動率內容,都有可能“爆”,這表明,社交因素在其中既起到了甄別內容質量作用,也引導著賬戶間互動。


三、理解演算法機制,就理解了資訊流平臺“懂使用者”的邏輯


演算法型驅動產品不僅在資訊分發中逐漸成為主流,還大量應用在電商以及O2O交易平臺之中,這也是為什麼現在淘寶強調內容電商、拼多多強調“去中心化的商品興趣推薦”的原因。頭條使用者、市場人常文平認為,“演算法推薦雖然方便,應用在電商平臺,系統會結合使用者此前的搜尋資料結果顯示推薦,一些已購買的商品重複推薦,會白白浪費一些流量位置。”


這意味著,在內容領域“篩選”已消耗的優質內容的邏輯是否能真正在電商領域跑通,依然在摸索之中。


資訊流平臺的推薦演算法引擎被認為容易導致使用者獲取其他視角或領域的內容受到侷限;一些盲目的、無意識的點選都會在後續帶來大量並不會真正想看到的內容,在新使用者啟動期時容易出現。


解決此類問題的辦法是使用者有意識的訓練手機的應用裡的機器,才能得到高效、適合自己的個性化頁面;與此同時,演算法產品會越來越重視“好友圈”,通過人群親密程度與共同話題來更新使用者的興趣圈層。當然,如果以後資訊流平臺能夠設定到“特別關注”好友,把好友認可的內容分享給關注物件,或許能有助於優質內容獲取到更多的流量。


頭條使用者稱呼“太準了”以致於出現對使用者隱私利用的猜疑,背後也反映出今日頭條產品在“個性化推薦”上的確愈發成熟化。根據筆者的觀察,今日頭條之所以能夠達到這種境界,與其他資訊流平臺有兩個不同的特點:

一是,頭條產品的流量是複合利用的。頭條為了實現人機互動的高頻,不斷在今日頭條App接入新的功能,從自媒體資訊、西瓜視訊、火山直播、小視訊、微頭條、悟空問答、電商櫥櫃、付費專欄、圈子、小遊戲......使用者使用產品功能越多,平臺識別使用者的畫像體系越清晰,系統推薦就越個性化。

二是,頭條系眾多產品把技術力量和流量資源的“複用”發揮到極致、邊際成本降低,而其他很多公司如果不看到這一點,盲目去做多個App就會陷入到兵力分散、人才浪費的困境之中。


結合頭條演算法結合興趣社群與社交因素的推測可以看出,頭條做社交特點並不是表現在及時溝通上,而是通過內容作為共同連線點,拉近粉絲與自媒體、使用者與使用者之間的聯絡。


如果說微信的內容是為了社交粘性 服務的,那麼頭條的社交如微頭條、多閃等並非突出聊天,更是為了內容推薦更精準、使用者粘性更高,從而實現推薦“場景化”,以致於“懂使用者”資訊流平臺被誤會有“使用者隱私”的不安全感。


結語


使用者隱私保護在全球範圍內都是一個永恆話題,去年Facebook因為洩露使用者隱私負面事件導致市值大跌;國內使用者對於使用者隱私的焦慮和關切也與日俱增,隔一段時間國內就出現一些濫用使用者隱私的質疑,這需要引起平臺型企業的重視,堅持把使用者利益放在首位。


通過機器記憶的辦法來進行自發推薦,是資訊分發更加智慧化的表現,也使得使用者隱私保護自然成為更為敏感環節,使用者敏感隱私與網友所產生的資料本身是有區別的,前者屬於法律範疇,後者是技術範疇,個性化推薦意味著平臺對相應的隱私保護的升級,這事關資訊流平臺生存的根本;沒有使用者資料資源為基礎,資訊流平臺的個性化推薦和商業化也是空中樓閣。


對頭條演算法上述解讀不難發現,內容推薦演算法既離不開使用者上網行為資料化,也離不開使用者所關注的人,是“資訊找人”與“人找資訊”相輔相成;演算法由人創造,也可以服務於人,其邊界和許可權也可以由人來控制的,無需進行妖魔化或者神祕化。




https://www.toutiao.com/a6678623445778956811/

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2668021/,如需轉載,請註明出處,否則將追究法律責任。

相關文章