Google Brain 推薦演算法,給了 Youtube 新生

精算狗發表於2017-12-04

YouTube 整合 Google Brain 推薦演算法,視訊播放量提升 20 倍。

去年晚些時候,我在玩《羞辱2》(Dishonored 2)遊戲時,照常在 YouTube 上搜尋瞭如何通過遊戲中棘手的部分。和往常一樣,我找到了一個能回答我問題的視訊。

Google Brain 推薦演算法,給了 Youtube 新生

但是在我下一次訪問 YouTube 時,網站給我推送了更多引人入勝的《羞辱》遊戲視訊,比如:

我到 YouTube 去尋找我問題的答案,它則向我展示了一個宇宙。

隨後,我發現自己一天就要訪問 YouTube 好幾次。大多數時候我都漫無目的,我已經習慣了網站主動提供我會喜歡的視訊。一月份的時候,我迷上了一個叫 Pinegrove 的民謠搖滾樂隊,幾周內 YouTube 就向我提供了幾乎所有上傳到伺服器上的該樂隊現場演出。當我今年春天有了一個新公寓時,我開始更頻繁地下廚了。在我搜尋瞭如何做義大利麵包沙拉之後,YouTube 很快就向我推送了大量專業廚師:Byron Talbott、Serious Eat 的 J. Kenji López-Alt、以及 Tasty 團隊等。

YouTube一直都是非常實用。自從它於 2005 年成立,就一直是網路的中流砥柱。但是過去一年左右,反正對我來說,YouTube 似乎開始變得出奇的好。這個網站開始以怪異的準確性來預測我可能會感興趣的視訊——比以前精準太多了。那麼什麼改變了呢?

Google Brain 推薦演算法,給了 Youtube 新生

在 12 年的歷程中,YouTube 已經從一個搜尋驅動的網站轉變成了一個本身就是目的地的網站。實現這一轉變需要數百次的實驗、少量的重新設計,以及在人工智慧領域的一些重大飛躍。但是真正提升了 YouTube 的,是其在 feed 上的演化發展。

雖然現在很難回憶起來,但是 YouTube 最初不過是基礎設施:它提供了一個把視訊嵌入其他網頁上的簡便方法,這也是你最可能用到它的地方。隨著 YouTube 的發展,它成了一個尋找檔案電視剪輯、補深夜喜劇,以及觀看最新熱點視訊的網站。除了維基百科以外,YouTube 很可能是網上最引人入勝的地方。你的同事在飲水機旁邊提到了 Harlem Shake,於是你花了餘下的整個晚上,去 YouTube 上看了 Harlem Shake 的視訊。

與此同時,Facebook 已經發明瞭我們這個時代的定義形式:News Feed。它是根據你的興趣,個性化定製的無限更新流。Feed 佔領了消費者網路,從 Tumblr 到 Twitter,到 Instagram,再到 LinkedIn。YouTube 早期實現個性化的方法要更有限,包括要求使用者訂閱頻道。這個比喻來自於電視,並且產生了混雜的結果。雖然 2011 年的大量推送訂閱取得了一些成功,但是 ComScore 上的資料顯示,一個人觀看 YouTube 的平均時間卻沒有變化。

頻道不再像曾經那樣支配著 YouTube。現在,在手機上開啟 YouTube, 會發現它們隱藏在一個分開的標籤頁裡。而應用開啟的則是一個 feed 流,由根據使用者興趣定製的視訊集組成。當然有來自你訂閱頻道的視訊,但是還有來自你可能沒有看過的頻道的視訊,這些視訊跟你之前觀看過的視訊相關。

這就是為什麼直接搜尋了《羞辱》(Dishonored)視訊之後,我開始看到遊戲中的祕密行動和諷刺評價的推薦。YouTube 開發的工具使得它的推薦不僅是個性化的,而且極其準確,從而增加了整個網站的視訊觀看時間。

YouTube 推薦的技術領導 Jim McFadden 在 2011 年加入了公司,他說:“當人們知道他們是來找什麼的時候,我們知道他們會上 YouTube。我們也希望在他們不一定知道想找什麼的時候,為他們提供服務。”

在 2011 年 McFadden 加入 YouTube 幾個月後,我第一次訪問了這個公司。YouTube 當時和現在一樣,首要目標都是讓使用者花更多時間來觀看視訊。那時事情進行得不是特別順利。McFadden 說:“YouTube.com 作為一個主頁,並沒有大量參與度。我們想,既然這樣怎麼才能把它轉變成目標呢?”

Youtube 嘗試了很多方法。給頂部的視訊主(top creator)購買了專業攝影儀器。引進了 leanback,這個特性允許使用者在當前視訊播放時排列一會要看的新視訊。重新設計了 Youtube 主頁,突出訂閱頻道而不是單獨的視訊。

每個使用者觀看的視訊數量沒有變化,但是一個改變讓接下來的那個春天終於有了起色:YouTube 的演算法推薦不再基於視訊點選量,而是基於視訊觀看時長。

幾乎一夜之間,那些從誤導人的標題和縮圖中獲益的視訊主就發現他們的瀏覽量暴跌。更高質量的視訊不斷湧現,這些視訊與更長的觀看時間緊密相連。接下來的三年,YouTube 的使用者觀看時長每年增長 50%。

我訂閱了幾個頻道,並認為自己稱得上是一個 YouTube 的常客。但是要想讓它變成一個每天能被訪問很多次的網站,YouTube 需要一些新的工具——這些工具在過去 18 個月內才成為現實。

這個月當我拜訪 YouTube 辦公室時,McFadden 揭示了 YouTube 突然的準確推薦的原因:Google Brain,它是母公司的人工智慧部門,YouTube 從 2005 年開始使用它。Google Brain 不是 YouTube 使用人工智慧(AI)的第一次嘗試。YouTube 之前利用過 Google 建立的系統 Sibyl,將機器學習技術應用於推薦。但是 Google Brain 應用了一種叫非監督學習的技術:它的演算法能夠找到不同輸入之間的關係,而軟體工程師永遠想不到這些關係。

“它的關鍵之一是,它能夠概化(generalize)。然而之前,如果我看了一個喜劇演員的視訊,我們的推薦很擅長說,這還有一個和它一樣的視訊。但是 Google Brain 模型能選出其他相似但並不完全一樣的喜劇演員——甚至有更緊密的關係。它能夠看到不那麼明顯的模式。”McFadden 說。

舉個例子,Brain 演算法開始向 YouTube 手機應用使用者推送短視訊, 向電視應用使用者推送長視訊。它推測,根據平臺來推送不同時長的視訊,能夠增加視訊觀看時長;這個想法是正確的。YouTube 在 2016 年釋出了 190 個類似的改動,並且會在今年逐步釋出另外 300 個。Todd Beaupre 是 YouTube 挖掘團隊的產品組經理,他說:“事實是,大量小的改進隨著時間逐步積累。對每一個改進,你嘗試了 10 件事,併釋出一個。”

Brain 演算法比 YouTube 之前運算得更快。過去幾年,它需要花幾天時間來將使用者行為與未來推薦整合起來。該公司說,這使得公司很難確定熱門主題。“如果我們想要讓使用者回來,弄清現在正在發生什麼,那麼我們已經從某種程度上解決了這個問題。現在的延遲是用分鐘或者小時計算的,而不再是幾天了。”Beaupre 說。

整合 Brain 產生了巨大的影響:超過 70% 的 YouTube 視訊觀看時長都是由演算法推薦產生的。每天,YouTube 向使用者推薦 200 萬個不同的、76 種語言的視訊。人們在 YouTube 主頁上觀看視訊的總時長比三年前增長了 20 倍。

這大概和我自己的行為對上了。幾年前,我開始經常在午餐時間訪問 YouTube 主頁,這樣吃飯的時候可以看看視訊。但是它的推薦足夠好,讓我開始更經常地給自己 YouTube 休息時間。本週我失控了,在 PlayStation 4 上登陸了 YouTube,這樣我就能在我所擁有的最大螢幕裝置上看推薦視訊了。

這就是真正個性化 feed 的強大之處。但是我對 YouTube 的感覺,與其他組成電子生活的事物很不同;這讓我感到吃驚。Facebook 的 feed 是基於好友的動態,以及你點過讚的主頁的動態。它能告訴你誰訂婚了或者生孩子了。但是我覺得,這些關於好友里程碑式事件的動態內容沒那麼有趣。Twitter 中則有關注人的推文,以及他們轉推的內容。作為一個記者,我幾乎被要求住在 Twitter 裡,儘管最近主頁的時間線裡只有無窮無盡的、慌張的尖叫。

每種 feed 都有它的長處,儘管 2017 年讓它們消減了。在 Twitter 上,無論你關注了誰,政治都主導了所有討論。Facebook 對事件和組這類特徵的一時熱情導致它的 feed 週週都以不和諧的方法轉變,讓我覺得我和好友們不再那麼相聯。(都是圖片的 Instagram 仍然像個綠洲,這個應用仍然在快速增長也不是什麼奇蹟。)

Facebook、Twitter 和 Instagram,他們的 feed 都經常要求你在他們的平臺上表演;這似乎很顯著。YouTube 明顯是由表演驅動的,即使只有小部分的使用者上傳過視訊,它也不曾對使用者施加壓力,要求他們上傳視訊。人們可以被動地享受 YouTube,就像它想方設法地想要取代的電視訊道。在這個瘋狂的時代,在沒有被問到我對當天新聞的反應時,有些東西也能保持鎮靜。

YouTube 強調與你可能喜歡的視訊相關聯的視訊,這意味著它的 feed 似乎總要比它同型別的網站在視野範圍上更廣、更好奇。YouTube 越是在遠的地方尋找內容,它越像是想要逃離其他 feed。在黑暗的一年,我會接受 YouTube 提供的所有東西來逃避現實。

2013 年,Alexis Madrigal 在 Atlantic 上寫道,假定我們知道 feed 已經達到了頂峰。他認為,未來是屬於有限的經歷的:時事通訊郵件、Medium 專欄、10 集的 Netflix 劇集。畢竟,無窮無盡的內容流讓人感到疲憊。“當媒體主義的秩序廢止時,自由不會衝進真空吸塵器裡,但是會產生一個有著它自己邏輯的新興秩序。”Madrigal 寫道。“我們發現,流引進了它自己種類的強烈慾望和約束。更快!更多!更快!更多!更快!更多!”

4 年來,YouTube 的方法表明 feed 只會變得更加重要。抵制一個與不斷提高的個性化方法相對應的、不斷增長的視訊庫是困難的。YouTube 現在對使用者進行了調查,調查他們有多喜歡推薦給他們的視訊;隨著時間流逝,結果會使 YouTube 更聰明——會導致更多的視訊被「消費」。

Beaupre 向我把這個過程描述成穿過峽谷。“這裡有與你喜歡過的視訊緊密聯絡的視訊,也有熱點和流行的視訊。但是在這之間,是魔法區。”如果 YouTube 的對手無法找到穿過峽谷的路,他們可能會發現很難與 YouTube 抗衡。

相關文章