眾所周知,YouTube能根據熱門影片、歷史觀看記錄以及其他訊號向使用者推薦他們可能會喜歡的影片。谷歌的一位工程主管克里斯托斯•古德洛(Cristos Goodrow)表示:YouTube觀眾最常反應的一個問題,是不知道究竟該看些什麼,而YouTube影片發現團隊的職責正是解決這一問題。
谷歌一直想把YouTube變成更像電視的平臺,不但斥巨資打造專業水準的頻道節目,還努力增加使用者訂閱的頻道數量——這都是為了將使用者的逗留時間從以“分鐘”計延長到以“小時”計,從而促進網站廣告收入向電視看齊。不過,YouTube現在還沒有製作出像Netflix的《紙牌屋》(House of Cards)和《女子監獄》(Orange is the New Black)那樣的高人氣“神作”。
然而,YouTube首次獲得技術艾美獎,卻是因為與電視大相徑庭的東西——能從海量內容中“沙裡淘金”、打造深度個性化體驗以延長使用者注意力的演算法。雖然目前在YouTube上最火的是各種頻道,但任何曾經陷在一串串相關影片裡無法自拔的人都會說,推薦演算法或許才是YouTube的最有價值資產。
使用者最愛不相關的“相關影片”
YouTube開始大力向使用者推薦相關影片是在2008年,那時它已經問世3年並被谷歌收購了2年。而在YouTube主頁以及影片頁面右側推薦其他影片的做法很快就收到了成效——到2008年底,該演算法每天都會讓使用者的觀看時長增加數十萬小時,而古德洛表示這一數字如今已經以“億”為單位了。
與此同時,YouTube也學到了一些出人意料的竅門,例如:向使用者推薦與他們當前觀看內容最密切相關的影片,其實反而會讓使用者生厭。參與YouTube推薦演算法構建的軟體工程師海克特•易(Hector Yee)指出:“使用者喜歡豐富多樣的題材。”
有時候,使用者最有可能點選的“相關”影片其實與當前觀看內容根本不相關。YouTube影片發現團隊在實驗中瞭解到,我們常常在個人興趣範圍內從一個主題跳到另一個主題。
機器學習演算法好比“會計記賬”
古德洛表示:YouTube構建推薦演算法的最大優勢,在於掌握了與使用者個人喜好相關的海量資料。YouTube既能抓取諸如使用者“贊”了哪段影片之類的明確訊號,還能抓取諸如使用者把哪段影片從頭看到尾之類的隱含訊號——將所有這些資料綜合起來,YouTube就對使用者可能會點選什麼內容有譜了。
在談到YouTube使用的機器學習技術時,古德洛將其比作“會計記賬”:YouTube的演算法會記錄使用者們觀看影片的次序,而當某位使用者觀看某段影片時,演算法會以其他使用者看過這段影片後緊接著看了哪些影片為依據,認為該使用者可能也會對這些影片感興趣,從而讓它們出現在右側。
古德洛還表示,YouTube的推薦演算法仍有巨大改進空間,而當前一大目標是讓使用者無需到處點選就能舒舒服服地一段接一段觀看他們喜愛的影片、一口氣看上30分鐘或一小時。
當然,古德洛也承認YouTube除了需要出色的推薦演算法之外,也需要出色的影片內容。