從0到1到無窮，vivo大規模機器學習實踐

tianxiaoxu發表於2018-05-07

原文網址 : http://blog.itpub.net/31137683/viewspace-2154041/

相信大家都對IT大廠的機器學習應用的建設很感興趣，如果有技術大咖們能夠從零開始和大家詳細分享一下他們大規模機器學習實踐，是不是一件再好不過的事情了。2017年10月19日-21日，由IT168主辦的第九屆系統架構師大會，就邀請到了vivo網際網路演算法團隊負責人李珂和我們分享vivo從0到1再到無窮的機器學習實踐。

從0到1到無窮，vivo大規模機器學習實踐
▲vivo網際網路演算法團隊負責人李珂

　　機器學習演算法在vivo落地的時候，李珂團隊遇到了所有初創團隊都會遇到的問題——人少坑多技術弱。當時整個vivo網際網路演算法團隊只有李珂和應屆畢業生兩個人，但是他們克服了這些種種困難在2016年推出了第一代解決方案架構。

從0到1到無窮，vivo大規模機器學習實踐

　　這個解決方案很好的利用了現有大資料架構，不僅對演算法團隊的技能要求單一，而且對於工程團隊的要求也很低，出錯的機率也較小。但是由於離線預測，很多實時特徵用不了，而且離線訓練，模型更新也較慢，使用Spark進行訓練，可選模型少，效率低，訓練資料的規模有瓶頸。

　　為了解決第一代離線使用的弊端，vivo網際網路演算法團隊在2017年上半年推出了第二代解決方案。與第一代相比，第二代最顯著的特點就是實現了實時預測和線上訓練，不僅能夠使用上下文，時間等場景資訊，而且能夠學習新廣告，適應概念漂移。

從0到1到無窮，vivo大規模機器學習實踐

　　但是第二代解決方案大量使用實時資料，工程端承擔線上預測部分開發，出錯的可能性增大，而且演算法迭代涉及大資料和工程改動，成本高週期長。李珂表示在第二代解決方案開發的過程中得到了重要的經驗，實時特徵工程一定要存原始資料，客戶端上傳日誌的時候要透傳預測的CTR和requestID，模型要先做線下驗證，不光是整體的，還要單個item的。

從0到1到無窮，vivo大規模機器學習實踐

　　現在vivo使用的是第三代解決方案，這個方案主要增加了召回模組，支援多條拉鍊的並行召回，支援離線或者線上更新拉鍊，支援灰度拉鍊熱拔插。據李珂介紹該解決方案主要應用在vivo資訊流推薦、關聯廣告和搜尋廣告等業務中。

　　李珂認為現在的解決方案也不是完美的，還存在很多不足，主要問題還是出在Spark上，Spark不支援FM，DNN等業界較先進的模型，而且因為沒有Parameter Server，executor的CPU利用率最多到30%。所以未來會考慮選擇TensorFlow CPU Cluster來做替補，通過Kubernetes+Docker彈性部署。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/31137683/viewspace-2154041/，如需轉載，請註明出處，否則將追究法律責任。

學習seo如何從0到1
2018-08-23
gtest學習教程(從0到1)
2022-12-15
從Spark MLlib到美圖機器學習框架實踐
2018-10-19
Spark機器學習框架
Python從0到1的學習之道
2018-11-26
Python
從0到1，如何在6周內成為機器學習工程師
2018-04-26
機器學習工程師
從0到1實現Promise
2018-09-28
Promise
雲開發實踐：從 0 到 1 帶你玩 AI
2024-11-18
AI
《從0到1學習Flink》—— 如何自定義 Data Source ？
2018-11-07
Flink 從 0 到 1 學習 —— 如何自定義 Data Sink ？
2019-09-21
PHash從0到1
2020-12-09
從0到1開發實戰手機站（二）：Git提交規範配置
2019-01-25
Git
Flink 從 0 到 1 學習 —— Flink 配置檔案詳解
2019-09-21
從0到1實現VueUI庫思路
2018-11-25
VueUI
node專案從0到1實戰
2022-02-15
從0到1，資料治理一週年大紀實
2022-07-25
測試開發：從0到1學習如何測試API閘道器
2021-05-27
API
0到1，Celery從入門到出家
2018-09-27
[譯] Flutter 從 0 到 1
2019-01-07
Flutter
從0到1實現一個簡單計算器
2021-02-06
RecyclerView從認識到實踐(1)
2019-03-22
View
從 0 到 1：我的 Flutter 技術實踐 | 掘金技術徵文
2018-07-10
Flutter
【機器學習】--Adaboost從初始到應用
2018-04-08
機器學習
《從0到1學習Flink》—— Flink 讀取 Kafka 資料批量寫入到 MySQL
2019-02-24
KafkaMySql
大規模機器學習在愛奇藝視訊分析理解中的實踐
2019-03-08
機器學習
webpack從0到1超詳細超基礎學習教程
2018-05-27
Web
吳恩達機器學習筆記 —— 18 大規模機器學習
2018-08-04
吳恩達機器學習筆記
從0到1搭建DeltaLake大資料平臺
2024-10-16
大資料
《從 0 到 1：搭建一個完整的 Kubernetes 叢集》實踐踩坑
2019-12-13
從 0 到 1 認識 Typescript
2020-06-12
TypeScript
工業「嫁衣」，從0到1
2021-04-29
從0到1搭建域名郵件伺服器
2021-09-25
伺服器
vivo大規模Kubernetes叢集自動化運維實踐
2023-04-25
運維
vivo大規模 Kubernetes 叢集自動化運維實踐
2022-06-13
運維
【機器學習篇】--SVD從初始到應用
2018-06-12
機器學習
【機器學習】--xgboost從初識到應用
2018-06-14
機器學習
做產品，選擇從0到1還是從1到N？
2022-05-09
Hadoop 從 0 到 1 學習 ——第一章 Hadoop 介紹
2020-10-29
Hadoop
Flink 從 0 到 1 學習 —— 第一章 Flink 簡介
2020-10-14

從0到1到無窮，vivo大規模機器學習實踐

相關文章