從0到1到無窮,vivo大規模機器學習實踐
相信大家都對IT大廠的機器學習應用的建設很感興趣,如果有技術大咖們能夠從零開始和大家詳細分享一下他們大規模機器學習實踐,是不是一件再好不過的事情了。2017年10月19日-21日,由IT168主辦的第九屆系統架構師大會,就邀請到了vivo網際網路演算法團隊負責人李珂和我們分享vivo從0到1再到無窮的機器學習實踐。
▲vivo網際網路演算法團隊負責人 李珂
機器學習演算法在vivo落地的時候,李珂團隊遇到了所有初創團隊都會遇到的問題——人少坑多技術弱。當時整個vivo網際網路演算法團隊只有李珂和應屆畢業生兩個人,但是他們克服了這些種種困難在2016年推出了第一代解決方案架構。
這個解決方案很好的利用了現有大資料架構,不僅對演算法團隊的技能要求單一,而且對於工程團隊的要求也很低,出錯的機率也較小。但是由於離線預測,很多實時特徵用不了,而且離線訓練,模型更新也較慢,使用Spark進行訓練,可選模型少,效率低,訓練資料的規模有瓶頸。
為了解決第一代離線使用的弊端,vivo網際網路演算法團隊在2017年上半年推出了第二代解決方案。與第一代相比,第二代最顯著的特點就是實現了實時預測和線上訓練,不僅能夠使用上下文,時間等場景資訊,而且能夠學習新廣告,適應概念漂移。
但是第二代解決方案大量使用實時資料,工程端承擔線上預測部分開發,出錯的可能性增大,而且演算法迭代涉及大資料和工程改動,成本高週期長。李珂表示在第二代解決方案開發的過程中得到了重要的經驗,實時特徵工程一定要存原始資料,客戶端上傳日誌的時候要透傳預測的CTR和requestID,模型要先做線下驗證,不光是整體的,還要單個item的。
現在vivo使用的是第三代解決方案,這個方案主要增加了召回模組,支援多條拉鍊的並行召回,支援離線或者線上更新拉鍊,支援灰度拉鍊熱拔插。據李珂介紹該解決方案主要應用在vivo資訊流推薦、關聯廣告和搜尋廣告等業務中。
李珂認為現在的解決方案也不是完美的,還存在很多不足,主要問題還是出在Spark上,Spark不支援FM,DNN等業界較先進的模型,而且因為沒有Parameter Server,executor的CPU利用率最多到30%。所以未來會考慮選擇TensorFlow Cluster來做替補,透過Kubernetes+Docker彈性部署。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31137683/viewspace-2154041/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 從0到1實現PromisePromise
- 雲開發實踐:從 0 到 1 帶你玩 AIAI
- RecyclerView從認識到實踐(1)View
- 從0到1,資料治理一週年大紀實
- 從0到1實現VueUI庫思路VueUI
- node專案從0到1實戰
- 0到1,Celery從入門到出家
- [譯] Flutter 從 0 到 1Flutter
- 從 0 到 1:我的 Flutter 技術實踐 | 掘金技術徵文Flutter
- 從Spark MLlib到美圖機器學習框架實踐Spark機器學習框架
- 從0到1搭建DeltaLake大資料平臺大資料
- 從0到1 | 0基礎/轉行如何用3個月搞定機器學習機器學習
- 從 0 到 1 認識 TypescriptTypeScript
- Android Router 從 0 到 1Android
- 從0到1,滴滴DB自動化運維是這樣實踐的運維
- vivo大規模 Kubernetes 叢集自動化運維實踐運維
- vivo大規模Kubernetes叢集自動化運維實踐運維
- 從0到1開發實戰手機站(二):Git提交規範配置Git
- 從0到1,如何在6周內成為機器學習工程師機器學習工程師
- 學習seo如何從0到1
- gtest學習教程(從0到1)
- webpack從0到1使用指南Web
- 大規模機器學習在愛奇藝視訊分析理解中的實踐機器學習
- vivo 超大規模訊息中介軟體實踐之路
- 回顧·大資料平臺從0到1之後大資料
- 從0到1,成為大資料行業領袖大資料行業
- 從0到1實現自己的阻塞佇列(上)佇列
- 從 0 到 1 實現 react - onChange 事件以及受控組React事件
- QQ日跡Omi實戰開發,從0到1
- 從0到1實現專案Docker編排部署Docker
- 基於 qiankun 的微前端最佳實踐(萬字長文) - 從 0 到 1 篇前端
- 《從 0 到 1:搭建一個完整的 Kubernetes 叢集》實踐踩坑
- 回顧·知識圖譜在貝殼找房的從0到1實踐
- 基於 OPLG 從 0 到 1 構建統一可觀測平臺實踐
- vue 由0到1實現Vue
- DNSLOG平臺搭建從0到1DNS
- 從0到1,小白的前端摸索之路前端
- Android輪播圖從0到1Android