我的推薦系統學習之路

RecomAI發表於2019-02-25

原文網址 : https://juejin.im/post/5c737828518825620677d798

【推薦系統與機器學習導讀】總結了一個RD工程師的推薦系統學習之路, 更多推薦系統知識請關注 RecomAI

作為一個CS專業的本科畢業生, 當初進入網際網路領域時只是一個電商業務的RD開發工程師, 後來機緣巧合之下轉向了大資料領域, 後來又進入到了推薦系統的相關開發工作。回顧這些年的工作, 總結了一些經驗, 希望對那些有志於進入推薦系統相關領域的同學有一些幫助。

推薦/搜尋/廣告是目前機器學習成熟落地的三大馬車, 對各個網際網路公司商業變現有著重要的意義, 這三個業務在維度上有一些區別,比如搜尋的目標是降低延時增大query的相關性, 廣告的目標是增大CTR, 視訊推薦系統的目標是播放時長點選等綜合指標。但是從資料流和系統工程架構上看, 又非常相似。

對於想接觸或者剛接觸推薦系統的同學來說, 應該都看過下面這兩本書

一個比較大的問題是, 如果沒有參與到實際的推薦系統開發, 或者沒有牛逼實驗室的Buff下, 感覺每一章都能看的明明白白, 但是想自己寫一個簡單的推薦系統時卻無從下手, 無法想象像美團阿里頭條的推薦系統到底是如何落地的。

個人觀點認為導致這種情況的原因有以下幾點

1. 推薦系統是一個系統

推薦系統首先是一個系統, 作為有盈利的網際網路公司的核心, 就註定在整體架構上十分的複雜, 比如涉及到NLP，召回，排序, 接日誌洗日誌算模型, 書上說的推薦方式都是單一的, 比如利用CF(協同過濾) 進行推薦, 在實際落地中推薦的召回一般是有多路的, 這樣才會有多樣性。(書中甚至幾乎沒有提到過候選集這種每個推薦系統都存在的東西)

2. 與演算法關聯緊密

推薦系統是演算法落地比較早的領域之一, 對於 LR, GBDT, FM 這類傳統機器學習演算法有著大規模的應用, 傳統機器學習的一大基礎能力就是特徵工程, 這個跟個人的領域知識極為相關, 網上的資料很少, 幾乎是小圈子裡的屠龍之技, 具體的工業實現各家又不一樣，可供參考資料特別少。而對於深度學習模型來說, 要是想tf寫個程式碼一跑ctr直接就升幾個點, 哪個是痴人說夢, 具體的網路設計到底能有什麼效果與你的業務模式, 行為資料有很大關係, 有很大可能你上的deepFM還不如你的LR+GBDT

3. 資料問題

對資料的重視程度, 首先, 如果是一個小系統, 比如只有幾萬PV, 根本談不上用推薦系統提升效果, 工業界的推薦系統, 日誌就是血液, 包括曝光日誌, 點選日誌, 收藏日誌等等行為日誌, 每天的日誌量會很大, 這些日誌一方面用於更新模型, 另一方面進入實驗統計平臺, 計算各個演算法在過去時間的效果。另外諸如FM因子分解機模型, 如果你的日誌很少, 那就是一個超級超級稀疏的矩陣, 最後算出來的模型效果也不會很好, 特別是現在深度學習在工業街廣泛落地的情況下(Wide & Deep), 缺少大規模日誌的推薦系統就是無水之源無根之木。

因為這些原因, 所以我建立了這個公眾號【推薦系統與機器學習】, 希望能夠分享一下工業界推薦系統的一些常用架構，基礎知識，以及在資訊檢索領域前沿的一些研究和進展，希望與大家共同進步。

、

長按二維碼關注

推薦系統與機器學習

ID: RecomAI

推薦系統實踐學習系列（三）推薦系統冷啟動問題
2018-06-24
推薦系統之路 (2)：產品聚類
2019-05-05
聚類
19期推薦系統實踐學習(二）
2020-11-27
用深度學習打造自己的音樂推薦系統
2018-11-02
深度學習
Flink + 強化學習搭建實時推薦系統
2020-10-19
強化學習
Linux系統推薦學習的程式語言以及經驗
2020-05-07
Linux
學習Django的推薦
2021-06-12
Django
深度學習在推薦系統中的應用綜述（最全）
2018-05-05
深度學習
【推薦系統篇】--推薦系統之訓練模型
2018-03-26
模型
吳恩達機器學習筆記 —— 17 推薦系統
2018-08-01
吳恩達機器學習筆記
RecSys提前看 | 深度學習在推薦系統中的最新應用
2019-09-12
深度學習
淺談個性化推薦系統中的非取樣學習
2020-02-19
YouTube深度學習推薦系統的十大工程問題
2020-10-28
深度學習
如何學習嵌入式系統？我的嵌入式成長之路
2021-04-17
Mahout的taste推薦系統引擎（影片推薦案例）
2024-04-04
AST
【推薦演算法】推薦系統的評估
2024-12-03
演算法
【推薦系統篇】--推薦系統之測試資料
2018-03-27
雲音樂推薦系統（二）：推薦系統的核心演算法
2020-11-11
演算法
推薦系統概述
2018-10-31
python 推薦系統
2022-02-28
Python
基於深度學習的圖書管理推薦系統（附python程式碼）
2024-03-31
深度學習Python
《推薦系統實踐》筆記 01 推薦系統簡介
2020-11-22
筆記
如何將知識圖譜特徵學習應用到推薦系統？
2018-06-05
特徵
我的C語言學習之路
2020-10-03
C語言
我的Java後端學習之路
2019-05-06
Java後端
推薦系統論文之序列推薦：KERL
2021-05-17
推薦系統一——深入理解YouTube推薦系統演算法
2020-10-11
演算法
【推薦系統篇】--推薦系統介紹和基本架構流程
2018-03-26
架構
推薦系統應該如何保障推薦的多樣性？
2019-11-13
問題解決：構建基於深度學習架構的推薦系統！
2018-11-02
深度學習架構
「推薦系統的廣泛和深度學習」- 論文閱讀和翻譯
2020-02-03
深度學習
實時增量學習在雲音樂直播推薦系統中的實踐
2022-03-15
PredictionIO：開源的推薦系統
2018-10-16
序列推薦系統的前世今生
2023-11-08
推薦系統的評估方法
2020-12-01
推薦系統遇上深度學習(二十一)--階段性回顧
2018-07-19
深度學習
分散式機器學習框架與高維實時推薦系統
2020-07-20
分散式機器學習框架
《推薦系統》-DIN模型
2020-10-22
模型

我的推薦系統學習之路

【推薦系統與機器學習導讀】總結了一個RD工程師的推薦系統學習之路, 更多推薦系統知識請關注 RecomAI

相關文章