個性化海報在愛奇藝影片推薦場景中的實踐
導語
在資訊過載的時代中,如何把恰當的內容恰時地呈現給使用者,並且讓使用者快速、準確地看到自己喜歡或需要的內容,對一個影片平臺來說是一個非常重要且具挑戰的事情。
因此,愛奇藝技術產品團隊設計並實現了一套個性化海報生產與分發系統,本文將從整體框架、海報生產、海報分發、業務策略以及場景效果等幾個方面,一起看看個性化海報在影片推薦場景中的實踐。
背景
個性化推薦是根據使用者的興趣特點和點選或購買行為,向使用者推薦使用者感興趣的資訊或 商品,最大的優點在於,它能收集使用者特徵資料並根據使用者特徵,如興趣偏好,為使用者主動作出個性化的推薦。而在影片平臺上,海報則是使用者對某一部影片的第一映像,是影片的所有資訊縮影。使用者看或不看該影片,往往在快速瀏覽時就有了答案。
Netflix早在2014年開始為相同劇集製作多個海報,並調整文字內容、字型、設計顏色和風格,做了大量的線上推薦實驗。並主要得出以下3點結論:
1、海報形式便於使用者做決策:海報承載了更多的資訊,使用者看海報的時長比看字的時長高四倍,平均花費思考標題的時間只有1.8秒;
2、海報設計的質量非常關鍵:畫質差會讓使用者覺得影片low,影響使用者對該影片的點選率;
3、海報中人物數量較重要:在海報設計中人物最好不要超過三個,人物越多使用者很難聚焦資訊,導致使用者對該影片的理解能力變差。
使用者為什麼點選這張,而不是另一張。是因為海報上有你的idol讓你情非得已?演員的誇張的表情讓你欲罷不能?又或者是海報的色調搭配、構圖設計讓你賞心悅目?還是其他未知的原因?
然而這不得不讓我們開始思考,在提供個性化內容的同時,能不能滿足使用者對不同海報的審美需求。這給影片平臺提出了一個新的挑戰。愛奇藝技術產品團隊設計並實現了一套個性化海報生產與分發系統,在愛奇藝的電視端與移動端進行了個性化海報分發的實踐,並得出結論:相比預設的單張海報圖,個性化海報圖的CTR(Click-Through-Rate即點選透過率)有明顯的提升。
個性化海報智慧生產與分發系統
圖 1 個性化海報圖整體框架
在獲取豐富的素材後,利用AI海報生產系統對海報、劇照素材進行智慧裁剪,對影片素材進行智慧截幀。自動化生產出大量候選圖片集合,為保證海報質量能100%分發到線上,需進行二次人工複審,複審後的精選海報集合進入個性化海報池。
海報的線上分發模組與傳統的影片推薦類似,對需要展示個性化海報的影片進行海報維度的召回、排序以及業務策略,最終為使用者推薦最優的個性化海報。下文將詳細介紹在AI海報製作、個性化海報分發以及線上實踐效果。
AI海報製作
智慧裁剪:基於圖片的AI海報製作
ZoomAI智慧增強技術,包含去噪、色彩增強等功能,畫質增強演算法可以用來提升圖片質量。用來進一步提升生成海報圖的質量。
智慧截幀:基於影片內容的AI海報製作
基於影片內容的AI海報製作,有一個新的挑戰是需要從海量的影片幀中選取合適的一些幀來作為生產素材,生產出高質量的海報圖,並且避免重複。因此,我們設計了智慧取樣模組來解決這個問題。
個性化海報分發
個性化海報的分發,分為離線、線上兩個部分:
離線部分,將海報圖片上傳CDN生產線上可用的圖片連結,並將海報圖索引資訊上傳資料庫。同時愛奇藝技術產品團隊還設計並實現了一套海報圖示籤特徵抽取系統,結合臉譜使用者側特徵以及使用者行為資料訓練個性化海報排序模型。我們嘗試了上下文無關MAB,上下文相關MAB以及淺層或深度排序演算法,如FM、DeepFM等。
線上部分,我們透過愛奇藝推薦平臺,快速實現並部署了高可用的個性化海報服務。首先根據場景的配置,召回不同來源、不同尺寸、不同召回模型的海報集合,再利用訓練好的模型對召回集合好個性化排序,最後根據業務需求應用不同的策略邏輯,將最合適的海報分發給使用者
特徵抽取
海報圖排序模型
在海報積累足夠使用者行為之前,我們並不能提前知道使用者在看到海報之後如何反饋,也就是不能提前獲得收益,唯一能做的就是不停地嘗試Exploration,並收集反饋更新策略,目的是使得整個過程損失的收益最小。這一過程就是十分經典的的多臂賭博機問題(Multi-armed bandit problem, MAB)。我們應用MAB演算法是將不同的海報候選當做賭博機的多個臂,不斷的試探使用者,讓效果更好的海報的展示機會更多。
上下文無關MAB
上下文無關的MAB有很多經典的演算法,比如基於貪婪優先的Epsilon-Greedy演算法,基於最大置信區間的UCB演算法,以及基於Beta分佈假設的ThompsonSampling演算法。為了捕捉使用者不同時間段的興趣愛好,經過對幾種演算法的實驗對比,我們最終採用了一種基於滑動時間視窗的MAB演算法。
上下文相關MAB
海報排序模型
線上隨機小流量
海報應用策略
基於Tag的豐富度:每個影片有N個海報圖候選,每個海報候選都有很Tag特徵,有表示圖片構圖的,有表示圖片內實體的。我們根據場景的需求,在視窗內限制每類Tag的海報數量。 基於圖片相似度的豐富度:基於海報圖的特徵向量的相似度,應用MMR&Rule相似度打散演算法。
2、展示降權
使用者對於長影片的觀看決策週期比較長,我們在不同場景進行了實踐,同一個影片可能對於同一個使用者展示多次。使用者海報維度的展示降權不僅能增加海報圖模型的探索性,也會讓使用者看到這個影片不同風格型別的海報圖,吸引使用者做出決策。
3、海報退場
對於影片的海報候選集合,我們設計了一套新增海報的爬坡退場機制。對於新增的海報候選,逐步的擴大其分發量與分發的使用者量。實時監控其CTR,對於沒有達到預期的海報圖,進行適當的降級,直到退場處理,有效的保證線上效果不會受到新增海報的較大負面影響。
4、場景匹配
在某些線上場景,我們嘗試了與場景結合的策略,主要是應用了圖片Tag與展位展示文字資訊的相似匹配。比如電影專題,Card的標題會顯示的標識出明星的名字。如果我們優先的為使用者推薦包含該明星名字的海報,使用者將更容易理解,使用者的體驗將會進一步提升。實驗資料也證明,這個策略對於該場景的效果也會有提升。
線上實踐效果
在電視端、移動端的不同場景,我們均進行了小流量實驗。並且統計了展位維度、單片維度、海報維度三個維度的效果,均有不錯的提升。
上圖是兩個場景展位維度的CTR與UCTR資料,可以看到實驗組,尤其是最優分桶的提升比較明顯。下面可以看看一些海報維度的效果示例:
圖 4 海報維度效果示意圖
寫在最後
參考文件
https://medium.com/netflix-techblog/artwork-personalization-c589f074ad76
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69945252/viewspace-2673693/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 愛奇藝個性化推薦排序實踐排序
- 淘寶個性化推薦中的多場景模型建模實踐模型
- 深度模型DNN在個性化推薦場景中的應用模型DNN
- TensorFlow在美團外賣推薦場景的GPU訓練優化實踐GPU優化
- 美圖個性化推薦的實踐與探索
- 個性化推薦系統實踐應用
- 攜程個性化推薦演算法實踐演算法
- 機器學習在銷售報價單的產品推薦場景中的作用機器學習
- 有贊個性化推薦能力的演進與實踐
- 多場景多工學習在美團到店餐飲推薦的實踐
- AI 在愛奇藝影片廣告中的探索AI
- 大伽「趣」說AI:在多個場景中的AI落地實踐AI
- 深度學習之雙DNN排序模型:線上知識蒸餾在愛奇藝推薦的實踐深度學習DNN排序模型
- Debias 技術在金融推薦場景下的應用
- 楊玉基:知識圖譜在美團推薦場景中的應用
- 雲原生技術在離線交付場景中的實踐
- 個性化推薦系統來了
- 餐館個性化推薦應用
- TDengine的實踐場景
- 大規模機器學習在愛奇藝視訊分析理解中的實踐機器學習
- 深度召回在飛豬旅行推薦系統中的探索和實踐
- JS 中 this 在各個場景下的指向JS
- Embedding在騰訊應用寶的推薦實踐
- 實時增量學習在雲音樂直播推薦系統中的實踐
- 淺談個性化推薦系統中的非取樣學習
- Sermant在異地多活場景下的實踐
- RocketMQ 在多 IDC 場景以及多隔離區場景下的實踐MQ
- 愛奇藝元件化設計在會員業務的應用和實踐元件化
- 個性化推薦引擎:外界對推薦演算法攻擊的影響演算法
- 推薦演算法在商城系統實踐演算法
- Amazon Personalize個性化推薦在亞馬遜雲科技中國區域上線亞馬遜
- 實時增量學習在雲音樂直播推薦系統中的工程實踐
- 愛奇藝在服務網格方向的落地實踐
- 多模態人物識別技術及其在愛奇藝視訊場景中的應用
- 多場景靜態化編譯在兩輪SAAS用車實踐編譯
- 智慧推薦系統:個性化推薦引領消費新潮流
- 安全容器在邊緣計算場景下的實踐
- MySQL樂觀鎖在分散式場景下的實踐MySql分散式