人人直播帶貨的時代,推薦模型為什麼比不過李佳琦們?

大資料文摘發表於2020-05-07

大資料文摘

作者:袁峻峰

人人直播帶貨的時代,推薦模型為什麼比不過李佳琦們?

疫情期間,各平臺線上直播帶貨量都大幅上漲,具研究機構艾媒諮詢釋出的資料顯示,2019年中國直播電商行業的總規模達到4338億元,預計2020年中國線上直播的使用者規模將達5.24億人,市場規模將突破9000億元。本文將探討,對比與直播帶貨,推薦模型有哪些不足。


既然是對比,我們限定直播帶貨中特定模式,流量、知識帶貨:內容種草+電商變現,內容種草的地方包括小紅書、抖音、快手以及自媒體等,然後把種的草集中到天貓、淘寶成交。淘寶直播一哥李佳琦,之前是歐萊雅BA,美妝博主,專業性沒話說,隨意說一個口紅色號,他能夠3秒從身後的幾千只口紅中找出這支。加上形象好,有個性:毒舌+嫌棄臉+翻白眼,大牌照樣吐槽,破除大家的品牌迷信,建立了一種“聽李佳琦沒錯”的信任。羅永浩,更不用說,用自己的形象為錘子手機代言,粉絲們買票看產品釋出會。轉戰直播帶貨,原有的錘子粉絲也跟隨羅永浩到抖音,創下了首播支付交易總額超1.1億元,累計觀看人數超4800萬人的記錄。因為粉絲還是信任老羅的專業能力,相信他帶的貨是價效比高的。


信任是前提,可以降低選擇成本,購買大品牌的原因也是如此。生活中從來不缺推薦與建議,來自父母、老師、朋友、專業顧問,以及各種社交媒體,大部分建議是徒勞和空洞的,建議者和被建議者之間是要有支點的,這種支點是可以是親情、友情或各種其他感情或專業性等等。


直播主的口碑和信任需要積累,只有能給客戶帶來價值,才能長期賺錢。按道理來說,電商、影片等平臺的推薦模型應該也是如此。但事實上,推薦模型的評價指標是非常短期、甚至是實時的。在網際網路公司,一個模型是否上線是要經過AB 測試。各大網際網路公司都會有完善AB測試框架,以方便不同功能快速部署AB測試,透過客戶實際效果反饋不斷迭代完善功能。AB測試本質上是個分離式組間實驗,不斷獲取客戶反饋既新資訊,持續最佳化模型效果。而評價不同推薦模型的最終效果,決定是否上線,是由一系列模型指標決定的。


這裡需要先介紹幾個推薦模型評價指標概念。推薦模型評價指標,通常最主要指標是準確性指標,包括準確率和召回率。


  • 準確率:推薦列表中使用者喜歡的物品佔全部推薦列表的比例。
  • 召回率:推薦列表中使用者喜歡的物品佔有全部使用者喜歡列表比例。

其他的評價推薦指標還包括:

  • 使用者滿意度 (User Satisfaction):使用者反饋的滿意率,可透過點選率、轉化率等指標衡量。

  • 覆蓋率(Coverage):是否公平的覆蓋了全部物品列表和使用者列表。

  • 多樣性(Diversity):推薦列表中涵蓋使用者各方面的興趣的比例。

  • 新穎性(Novelty):演算法推薦給使用者可能感興趣,但很少接觸的物品。 

  • 可解釋性(explanation):推薦理由。

  • 健壯性(Robustness):指推薦系統中抗攻擊、反作弊等功能。


這些模型評價標準看過去都是和客戶利益一致的。但最終決定一個模型是否上線是由推薦系統的商業目的決定的。對於電子商務的推薦系統,最終的商業目標通常是平臺的交易量。對於音樂、電影、新聞、短影片等平臺的推薦系統,最終的商業目標是使用者點選與平臺觀看停留時間。

大資料中很大一部分是網際網路平臺的使用者行為資料,正是有了這些資料基礎,才能構建推薦模型。推薦模型的本身原理是合理的,基於使用者偏好等相關特徵進行推薦,有效降低了使用者搜尋的成本;推薦模型的評價標準大抵是合乎使用者利益的。但最終,推薦模型是否線上部署的評價標準必然是基於平臺自身商業目標考慮。不由讓人覺得是“白眼狼”,他們用著使用者的資料,模型的終極目標卻是為了各網際網路平臺自己的商業目的。當然,如果既能提升那些使用者滿意度、覆蓋率、多樣性、公平性等指標,又能提升平臺的各項商業指標當然最好。只要當魚和熊掌不可兼得時,最終線上模型往往不一定是完全從使用者利用考慮。雖然,從商業角度來看,誠然亦是無可厚非的。

重要的是,點選率、轉化率作為模型目標得到結果只能是預測了使用者最可能的行為,但使用者需要的是做出更理性的決策。

諾貝爾經濟學獲得者保羅·薩繆爾森提出顯示偏好公理(Weak Axiom of Revealed Preference)認為:如果消費者的行為是追求效用最大化,那麼消費者在市場上所能購買的商品組合就是他所能購買的最優商品組合,這些實際購買的商品組合優於那些消費者有能力購買而沒有購買的商品組合。即如果組合A直接顯示出比B更被消費者所偏好,而且,A和B不同,則不可能有直接顯示出B比A更被消費者偏好。顯示偏好公理是現代新古典主義經濟學的基石之一。透過可觀察行為,揭示了行為主體的偏好包括隱藏偏好。比起那些不可觀測的其他經濟學效用理論,更可實踐。可觀測、可量化也正是資料建模的基礎。推薦與排序模型都是基於使用者偏好的,這也十分符合以上經濟學原理。如,基於協同過濾的推薦模型,對使用者喜歡的產品或內容進行分析, 發現使用者A和使用者B很像,所以假設他們有類似偏好,即他們都喜歡差不多的東西, 使用者B喜歡了某個產品或內容, 而使用者A還沒有購買或看過, 那麼就把這個東西推薦給使用者A,這就是使用者協同過濾模型(User-Based CF)的原理。可以看出該模型的前提假設和顯示偏好公理是一致的。

但神經科學發現,偏好之間關係是不穩定的,當一個行為主體進行知覺判斷時,他要經歷一個隨機的認知過程,做出一個隨機的偏好決策。保羅·格萊姆齊教授分析、設計了幾個神經科學實驗,其中之一是透過監控猴子腦區神經元放電率與對某個給定的事物之間的關係,試圖估計猴子對該事物的獎賞相關偏好機率。神經科學實驗詳細描述還是先行略過。該實驗得到的結論是,猴子的偏好決策是採用啟用一個神經迴路實現的,該神經迴路會在多個備選項之間設定一些閾值,類似一個“贏家通吃”的運算。“神經生物學家對神經系統的研究告訴我們,所有的訊號(期望主觀價值也是一個神經訊號)都是隨機的。”[1]

所以,偏好是存在隨機性,新古典經濟學的顯示偏好公理中,固定的偏好序列假設是有缺陷的,基於該假設的期望效用理論下理性決策是不成立的。應該認為偏好是情境的、過程敏感的,甚至是有可能偏好反轉的。藉助各種誘導能夠改變偏好因素的相對權重,從而產生不同的偏好順序,或者說,偏好是在誘導過程中建立起來的。這也是廣告的價值所在,也是推薦模型,直播帶貨的價值所在。“經濟學家通常假設人們知道他們想要什麼,而廣告商則假定人們並不知道這些?”隨著這些年理論的發展,經濟學中理性人假設,行為主體瞭解自身偏好的假設等,已逐漸被有限理性假設所取代。

推薦模型基礎假設和最佳化指標點選率、交易轉化率都是和顯示偏好公理的原理一致的。亦是說,既然人們效用偏好具有隨機性,推薦模型中基於點選率、交易轉化率的模型最佳化目標和真實使用者最優效用並不一定一致。而直播帶貨是引導粉絲偏好,主播們為了構建長期信任,是需要幫使用者做出更好、更合理的選擇。

所以,對比與直播帶貨,推薦模型有這麼幾點不足

  1. 缺乏信任的支點。專業性體現不足,推薦模型可解釋性也是目前業內重點改進方向之一。

  2. 模型評價指標偏短期,並且不能完全反映使用者效用。

  3. 模型上線最終取決於APP、平臺的商業利益。

  4. 模型目標是預測使用者未來最可能的選擇,而不是建議使用者更合理的選擇。


當年蘋果創始人賈伯斯被問及Siri定位時,其回答“Siri不是搜尋公司,它是人工智慧公司。”由此可見,賈伯斯心裡,Siri的定位是作為跨時代的前驅性智慧產品,也預示著未來資訊處理將從搜尋推薦進化到智慧助理。更多的領域智慧助理探討,請參見即將出版的《人工智慧為金融投資帶來了什麼》[2]。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2690393/,如需轉載,請註明出處,否則將追究法律責任。

相關文章