摘要
正如Netflix競賽所證明的那樣,矩陣分解模型在生成產品推薦方面優於傳統的近鄰技術,允許合併其他資訊,如隱式反饋、時間效應和置信水平。本文主要對推薦系統中現有的矩陣分解技術進行綜述。
論文主要內容與工作
1、介紹基於內容的推薦系統原理,並舉了音樂網站Pandora.com的例子。
2、介紹協同過濾演算法,並將其分為neighborhood methods 和 latent factor models兩類。著重介紹了矩陣分解的原理。
3、矩陣分解的一個優點是它允許合併額外的資訊。當無法獲得明確反饋時,推薦系統可以使用隱式反饋推斷使用者偏好,隱式反饋透過觀察使用者行為(包括購買歷史記錄、瀏覽歷史記錄、搜尋模式甚至滑鼠移動)間接反映意見。隱式反饋通常表示事件的存在或不存在,因此它通常由一個密集的矩陣表示。
4、Basic MF、biases MF、嵌入額外資訊的MF、時序動態MF、考慮隱式反饋的MF
5、Netflix推薦大賽的情況
總結
矩陣分解技術已經成為協同過濾推薦的主要方法。Netflix等資料集的經驗表明,它們提供的準確性優於經典的近鄰技術。同時,它們提供了一個緊湊的記憶體效率模型,系統可以相對容易地學習。使這些技術更加方便的是,模型可以自然地整合資料的許多關鍵方面,如多種形式的反饋、時間動態和置信水平。
本作品採用《CC 協議》,轉載必須註明作者和本文連結
文章!!首發於我的部落格Stray_Camel(^U^)ノ~YO。