推薦系統工程架構

Heinrich♣發表於2024-05-04

推薦系統簡介

計算原理

我們把每個使用者/影片表示成空間中的一個點。
如果兩個點越接近,就認為這個使用者對這個影片的喜歡程度越高,反之越低。
使用者點贊這個影片就拉近兩點,沒點贊就拉遠兩點的距離。這樣就組成了整體推薦系統

推薦系統流程

從海量影片中召回使用者感興趣的影片,經過粗排模型初步篩選使用者最感興趣的幾百條影片,分數最高的前幾百,然後透過效果更好的精排模型再計算一遍分數,之後應用一些業務規則插,打散,送入系統混排廣告,最後返回給使用者。

名詞介紹

候選/物料庫

從一堆候選品中選擇一些物品給使用者,滿足使用者不明確的需求,候選品的數量很大,百萬千萬甚至是億萬級別。
候選集是一個龐大的,集海量物品為一體的大倉庫。推薦系統的上限受制於候選量級的數量。

召回

  • 難點:召回作用的物件是候選集,由於候選量巨大,召回所面臨的壓力也是巨大的,特別是時延方面
  • 數量級:從千萬,億級別的候選中粗篩,產出萬餘條資料
  • 作用:縮小候選集,縮小提供給使用者的範圍,從候選商品中進行粗篩,透過簡單的模型篩選出幾百到幾十件商品
  • 特點:資料量大,模型簡單,響應快,使用的特徵量少

排序

  • 粗排:對召回結果進行排序,topK送入精排。粗排的打分量遠遠高於精排,大概是1w條。
  • 精排:最純粹的排序,機器學習模組。目標只有一個,就是找到最準確的預測
  • 重排:業務排序層,機器學習返回的排序不一定完全符合業務要求,還要兼顧結果的多樣性,流行度,新鮮度等指標,然後還要插入廣告,用來對當前排序好的結果根據業務偏好再次排序。提權,打散,隔離,強插

相關文章