對於相同喜好的使用者,電商高手用Spark MLlib程式碼如何操作?

shenmanli發表於2017-10-30
日前,小編接觸了一個概念——協同過濾。相信很朋友也是第一次聽說,上網在某度搜一下,結果發現這個演算法居然是很成熟的。


“協同過濾簡單來說是利用某興趣相投、擁有共同經驗之群體的喜好來推薦使用者感興趣的資訊,個人通過合作的機制給予資訊相當程度的回應(如評分)並記錄下來以達到過濾的目的進而幫助別人篩選資訊,回應不一定侷限於特別感興趣的,特別不感興趣資訊的紀錄也相當重要。”


通過學習,小編了解到:在協同過濾中,有兩種主流方法:基於使用者的協同過濾,和基於物品的協同過濾。


基於使用者的 CF 的基本思想相當簡單,基於使用者對物品的偏好找到相鄰鄰居使用者,然後將鄰居使用者喜歡的推薦給當前使用者。

基於物品的 CF 的原理和基於使用者的 CF 類似,只是在計算鄰居時採用物品本身,而不是從使用者的角度,即基於使用者對物品的偏好找到相似的物品,然後根據使用者的歷史偏好,推薦相似的物品給他。


通過海量資料找到興趣相同的使用者確實是比較容易實現的!但這都是對於老使用者而言的。


問題是對於新使用者如何通過協同過濾演算法解決呢?演算法用Spark MLlib程式碼如何操作呢?


中科院計算所培訓中心將於11月6日晚8點,舉辦《機器學習實戰:揭開利用Spark MLlib進行個性推薦的奧祕!》歡迎報名學習!(具體詳情請到官網瞭解)

相關文章