個性化海報在愛奇藝影片推薦場景中的實踐

愛奇藝技術產品團隊發表於2022-12-05

導語

在資訊過載的時代中,如何把恰當的內容恰時地呈現給使用者,並且讓使用者快速、準確地看到自己喜歡或需要的內容,對一個影片平臺來說是一個非常重要且具挑戰的事情。

因此,愛奇藝技術產品團隊設計並實現了一套個性化海報生產與分發系統,本文將從整體框架、海報生產、海報分發、業務策略以及場景效果等幾個方面,一起看看個性化海報在影片推薦場景中的實踐。

背景

個性化推薦是根據使用者的興趣特點和點選或購買行為,向使用者推薦使用者感興趣的資訊或 商品,最大的優點在於,它能收集使用者特徵資料並根據使用者特徵,如興趣偏好,為使用者主動作出個性化的推薦。而在影片平臺上,海報則是使用者對某一部影片的第一映像,是影片的所有資訊縮影。使用者看或不看該影片,往往在快速瀏覽時就有了答案。

Netflix早在2014年開始為相同劇集製作多個海報,並調整文字內容、字型、設計顏色和風格,做了大量的線上推薦實驗。並主要得出以下3點結論:

1、海報形式便於使用者做決策:海報承載了更多的資訊,使用者看海報的時長比看字的時長高四倍,平均花費思考標題的時間只有1.8秒;

2、海報設計的質量非常關鍵:畫質差會讓使用者覺得影片low,影響使用者對該影片的點選率;

3、海報中人物數量較重要:在海報設計中人物最好不要超過三個,人物越多使用者很難聚焦資訊,導致使用者對該影片的理解能力變差。

使用者為什麼點選這張,而不是另一張。是因為海報上有你的idol讓你情非得已?演員的誇張的表情讓你欲罷不能?又或者是海報的色調搭配、構圖設計讓你賞心悅目?還是其他未知的原因?

然而這不得不讓我們開始思考,在提供個性化內容的同時,能不能滿足使用者對不同海報的審美需求。這給影片平臺提出了一個新的挑戰。愛奇藝技術產品團隊設計並實現了一套個性化海報生產與分發系統,在愛奇藝的電視端與移動端進行了個性化海報分發的實踐,並得出結論:相比預設的單張海報圖,個性化海報圖的CTR(Click-Through-Rate即點選透過率)有明顯的提升。

個性化海報智慧生產與分發系統

個性化海報在愛奇藝影片推薦場景中的實踐

圖 1 個性化海報圖整體框架


在獲取豐富的素材後,利用AI海報生產系統對海報、劇照素材進行智慧裁剪,對影片素材進行智慧截幀。自動化生產出大量候選圖片集合,為保證海報質量能100%分發到線上,需進行二次人工複審,複審後的精選海報集合進入個性化海報池。

海報的線上分發模組與傳統的影片推薦類似,對需要展示個性化海報的影片進行海報維度的召回、排序以及業務策略,最終為使用者推薦最優的個性化海報。下文將詳細介紹在AI海報製作、個性化海報分發以及線上實踐效果。

AI海報製作

巧婦難為無米之炊,個性化海報推薦首先要有海報候選集合。愛奇藝技術產品團隊自研自動化海報生產與裁剪技術,生產出很多優質的海報候選。

個性化海報在愛奇藝影片推薦場景中的實踐


圖 2 AI海報生產流程

智慧裁剪:基於圖片的AI海報製作

基於圖片的智慧檢測,我們將海報生成演算法分為了幾個模組,分別是基礎演算法、智慧截圖、智慧LOGO疊加、ZoomAI智慧增強技術,具體如下:
基礎演算法模組,主要利用多個AI演算法來獲取基於圖片的海報語義資訊。人臉、人體以及實體識別能有效的識別圖中的人物和其他實體,以及其所在位置資訊。並利於文字檢測演算法,我們可以知道文字出現的區域,避免出現文字被截斷。
智慧截圖模組,利用基礎演算法模組得到的資訊,進行智慧構圖,從而得到任意目標尺寸的截圖。智慧LOGO疊加模組的主要作用是自動地將美化後的劇名LOGO合成到上一步的截圖模組得到的圖片上。主要包括智慧佈局、智慧調色和多LOGO智慧選取等功能。

ZoomAI智慧增強技術,包含去噪、色彩增強等功能,畫質增強演算法可以用來提升圖片質量。用來進一步提升生成海報圖的質量。

智慧截幀:基於影片內容的AI海報製作

基於影片內容的AI海報製作,有一個新的挑戰是需要從海量的影片幀中選取合適的一些幀來作為生產素材,生產出高質量的海報圖,並且避免重複。因此,我們設計了智慧取樣模組來解決這個問題。

在智慧取樣模組中,我們首先會將影片進行場景切分,並且限制每個場景的素材數量,減少重複的同時提高生產效率。其次,取樣率會根據之前的結果動態調整,提高當前場景的生產率。同時,取樣率也和影片型別息息相關,如片花的取樣率會比正片高,因為片花會包含更加高密度的資訊。

個性化海報分發

個性化海報的分發,分為離線、線上兩個部分:

離線部分,將海報圖片上傳CDN生產線上可用的圖片連結,並將海報圖索引資訊上傳資料庫。同時愛奇藝技術產品團隊還設計並實現了一套海報圖示籤特徵抽取系統,結合臉譜使用者側特徵以及使用者行為資料訓練個性化海報排序模型。我們嘗試了上下文無關MAB,上下文相關MAB以及淺層或深度排序演算法,如FM、DeepFM等。

線上部分,我們透過愛奇藝推薦平臺,快速實現並部署了高可用的個性化海報服務。首先根據場景的配置,召回不同來源、不同尺寸、不同召回模型的海報集合,再利用訓練好的模型對召回集合好個性化排序,最後根據業務需求應用不同的策略邏輯,將最合適的海報分發給使用者

特徵抽取

在海報入庫之前,需要抽取海報本身的特徵。我們獲取候選海報圖的圖片基礎特徵、圖片質量特徵、明星特徵、輿情特徵、Embedding特徵以及行為統計特徵等,其中統計特徵包括實時和線上部分。

海報圖排序模型

在海報積累足夠使用者行為之前,我們並不能提前知道使用者在看到海報之後如何反饋,也就是不能提前獲得收益,唯一能做的就是不停地嘗試Exploration,並收集反饋更新策略,目的是使得整個過程損失的收益最小。這一過程就是十分經典的的多臂賭博機問題(Multi-armed bandit problem, MAB)。我們應用MAB演算法是將不同的海報候選當做賭博機的多個臂,不斷的試探使用者,讓效果更好的海報的展示機會更多。

  • 上下文無關MAB

上下文無關的MAB有很多經典的演算法,比如基於貪婪優先的Epsilon-Greedy演算法,基於最大置信區間的UCB演算法,以及基於Beta分佈假設的ThompsonSampling演算法。為了捕捉使用者不同時間段的興趣愛好,經過對幾種演算法的實驗對比,我們最終採用了一種基於滑動時間視窗的MAB演算法。

  • 上下文相關MAB

上下文無關的MAB能有效的利用使用者的群體智慧選擇合適的海報分發更多的流量,但是個性化不足。因此我們嘗試了上下文相關的MAB演算法:一個海報被選擇後推送給一個使用者,其回報和相關特徵成線性關係,這裡的“相關特徵”就是上下文,也是實際中發揮空間最大的部分。於是試驗過程就變成:使用者和海報的特徵預估回報及其置信區間,選擇置信區間上界最大的海報推薦,觀察回報後更新線性關係的引數,以此達到學習的目的。
應用的特徵包括使用者特徵與海報特徵,使用者特徵使用使用者臉譜的特徵,海報特徵參見上文的海報特徵抽取。在實際應用過程中,有時為了提升場景的豐富度,會隨機丟棄一些歷史特徵,以達到Exploration的目的。

  • 海報排序模型

與影片推薦排序類似,在蒐集了足夠多的使用者行為後,我們訓練了淺層的排序模型,如LR、FM與GBDT等,同時我們也嘗試了深度模型,如DeepFM等。因為篇幅的原因這裡不在詳細說明各種排序演算法。

  • 線上隨機小流量

值得一提的是,我們線上一直保留了一部分隨機小流量。一方面是增加Exploration,另一方面我們可以根據隨機流量的投遞日誌,離線重放實驗模型的預測結果,在評估AUC之後,離線的評估模型可能的效果收益,將效果不明顯的最佳化扼殺下搖籃裡,從而提升AB效率。

海報應用策略

1、海報溝通豐富度
同一個海報展位,如果展示的海報的構圖都比較類似,比如一排都是明星的表情特寫,整體上美觀度可能會有所影響,長期以往會讓使用者有種看到直播畫面的亂入感。因此我們根據業務需求,我們設計了兩種海報構圖豐富度演算法:

  • 基於Tag的豐富度:每個影片有N個海報圖候選,每個海報候選都有很Tag特徵,有表示圖片構圖的,有表示圖片內實體的。我們根據場景的需求,在視窗內限制每類Tag的海報數量。
  • 基於圖片相似度的豐富度:基於海報圖的特徵向量的相似度,應用MMR&Rule相似度打散演算法。

2、展示降權

使用者對於長影片的觀看決策週期比較長,我們在不同場景進行了實踐,同一個影片可能對於同一個使用者展示多次。使用者海報維度的展示降權不僅能增加海報圖模型的探索性,也會讓使用者看到這個影片不同風格型別的海報圖,吸引使用者做出決策。

3、海報退場

對於影片的海報候選集合,我們設計了一套新增海報的爬坡退場機制。對於新增的海報候選,逐步的擴大其分發量與分發的使用者量。實時監控其CTR,對於沒有達到預期的海報圖,進行適當的降級,直到退場處理,有效的保證線上效果不會受到新增海報的較大負面影響。

4、場景匹配

在某些線上場景,我們嘗試了與場景結合的策略,主要是應用了圖片Tag與展位展示文字資訊的相似匹配。比如電影專題,Card的標題會顯示的標識出明星的名字。如果我們優先的為使用者推薦包含該明星名字的海報,使用者將更容易理解,使用者的體驗將會進一步提升。實驗資料也證明,這個策略對於該場景的效果也會有提升。

線上實踐效果

在電視端、移動端的不同場景,我們均進行了小流量實驗。並且統計了展位維度、單片維度、海報維度三個維度的效果,均有不錯的提升。

個性化海報在愛奇藝影片推薦場景中的實踐

圖 3 虛擬場景A與場景B的展位維度效果示意圖

上圖是兩個場景展位維度的CTR與UCTR資料,可以看到實驗組,尤其是最優分桶的提升比較明顯。下面可以看看一些海報維度的效果示例:

 

個性化海報在愛奇藝影片推薦場景中的實踐

4 海報維度效果示意圖

 

寫在最後

個性化海報的智慧生產如何能從大量的海報中學習出通用的模式,並利用相關語義自動填充必要的元素,比如人物、物體。綜合考慮構圖與素材的生成式生產是未來的研究方向。我們也將研究個性化內容與個性化海報的排序模型融合,訓練端到端的海報圖排序模型, 同時兼顧影片內容和海報的影響,讓個性化推薦給使用者提供新的驚喜

參考文件

https://medium.com/netflix-techblog/artwork-personalization-c589f074ad76

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69945252/viewspace-2673693/,如需轉載,請註明出處,否則將追究法律責任。

相關文章