《推薦系統實踐》筆記 01 推薦系統簡介

NoMornings發表於2020-11-22

推薦系統簡介

什麼是推薦系統

由於當前社會由資訊匱乏轉變為資訊過載,需要篩選工具對資訊進行篩選,如個性化推薦系統,可以對那些沒有什麼明確需求的使用者進行推薦。如何從海量的資料中篩選出使用者真正感興趣的事情是一件非常具有挑戰性的事情。

推薦系統的任務就是聯絡使用者和資訊,一方面幫助使用者發現對自己有價值的資訊,另一方面讓資訊能夠展現在對它感興趣的使用者面前,從而實現資訊消費者和資訊生產者的雙贏。

目前具有代表性的解決資訊過載的方案就是分類目錄以及搜尋引擎。

和搜尋引擎不同的是,推薦系統不需要使用者提供明確的需求,而是通過分析使用者的歷史行為給用 戶的興趣建模,從而主動給使用者推薦能夠滿足他們興趣和需求的資訊。搜尋引擎和推薦系統基本上算作互補的工具。搜尋引擎滿足了使用者有明確目的時的主動查詢需求,而推薦系統能夠在使用者沒有明確目的的時候幫助他們發現感興趣的新內容。

推薦系統通過發掘使用者的行為,找到使用者的個性化需求,從而將長尾商品準確地推薦給需要它的使用者,幫助使用者發現那些他們感興趣但很難發現的商品。

介紹了三種推薦方式:

  • 社會化推薦: 讓好友推薦物品。
  • 基於內容的推薦: 尋找和自己之前看過的在內容上相似的物品或者內容。
  • 協同過濾: 找到和自己歷史興趣相似的一群使用者,看看他們最近在看什麼內容。

推薦演算法的本質是通過一定的方式將使用者和物品聯絡起來,而不同的推薦系統利用了不同的方式。

推薦系統的應用

  • 電子商務:推薦商品

如亞馬遜,會給出推薦商品的標題、縮圖等,同樣也會給出推薦的平均分以及推薦的理由。同時,使用者可以修改當前的推薦結果,存在互動的特性。亞馬遜的推薦系統存在基於物品的推薦,基於好友的推薦,協同推薦(買了此商品的使用者同樣也買了的商品)。打包銷售也是推薦系統常見的應用。

  • 電影和視訊網站

如Netflix、YouTube,個性化推薦系統在其中也是很重要的組成部分,Netflix在2006年起開始舉辦著名的Netflix Prize推薦系統比賽,給出了大規模使用者行為資料集。YouTube曾經做過一個實驗,比較了個性化推薦的點選率和熱門視訊列表的點選率,實驗結果表明個性化推薦的點選率是熱門視訊點選率的兩倍。

  • 個性化音樂網路電臺

如國際上著名的有Pandora,Last.fm,國內的代表則是豆瓣電臺,蝦米音樂等等。經過使用者一定時間的反饋,電臺就可以從使用者的歷史行為中習得使用者的興趣模型,從而使使用者的播放列表越來越符合使用者對歌曲的興趣。音樂很適合作為推薦,因為其具有消費代價小,數量規模大,重用率高,使用者激情大,具有序列特性,高度社會化等等特徵。

  • 社交網路

社交網路可以使用推薦系統做以下內容:利用使用者的社交網路資訊對使用者進行個性化的物品推薦,資訊流的會話推薦,給使用者推薦好友。如Facebook等等,可以提供個性化服務,熟悉會話排序等等。

  • 個性化閱讀

首先,網際網路上的文章非常多,使用者面臨資訊過載的問題;其次,使用者很多 時候並沒有必須看某篇具體文章的需求,他們只是想通過閱讀特定領域的文章瞭解這些領域的文章來了解這些領域的動態。國際知名的有Google Reader,國內有鮮果網等。個性化閱讀工具Zite則是收集使用者對文章的偏好資訊。如在每篇文章右側,Zite都允許使用者給出喜歡或不喜歡的反饋,然後通過分析使用者的反饋資料不停地更新使用者的個性化文章列表。

  • 基於位置的推薦服務

使用者的位置資訊已經非常容易獲取,而位置是一種很重要的上下文資訊。基於位置的服務往往和社交網路結合在一起,給使用者推薦離他近的且他感興趣的服務。

  • 個性化郵件

通過分析使用者閱讀郵件的歷史行為和習慣對新郵件進行重新排序,從而提高使用者的工作效率。

  • 個性化廣告

廣告是網際網路公司生存的根本。個性化推薦著重於幫助使用者找到可能令他們感興趣的物品,而廣告推薦著重於幫助廣告找到可能對它們感興趣的使用者,即一個是以使用者為核心, 而另一個以廣告為核心。廣告也分三種:上下文廣告,搜尋廣告以及個性化展示廣告。

後面的內容就是推薦系統的測評了,我就單獨寫一篇文章進行介紹。

相關文章