YouTube整合Google Brain推薦演算法,視訊播放量提升20倍

AI前線發表於2017-10-10

本文由 [AI前線]原創,ID:ai-front,原文連結:t.cn/ROfPoY5

去年某一天,當我正在玩一款名為《冤罪殺機 2》的電子遊戲時,我在YouTube上常規搜尋了一下,看看這個遊戲中一個棘手的部分怎麼通關。像往常一樣,我找到了回答我這個問題的一個視訊。但當我下次開啟YouTube的時候,網站卻給我推薦了更多更復雜的關於如何玩這個遊戲的視訊:玩家如何玩這個遊戲而不被敵人發現的視訊剪輯;玩家用高超的方法殺死每一個敵人的視訊剪輯;採訪遊戲製作者的視訊;精彩絕倫的諷刺評論。我只是去YouTube搜尋一個問題的答案,它卻像我展示了一個全新的宇宙。

後來,我發現自己每天都會訪問YouTube好幾次。大多數時候,我開啟這個網站都沒有什麼特別的目的,我已經習慣了被動地讓網站自動給我推薦點什麼我可能喜歡的東西。一月份的時候,我開始痴迷於一個叫Pinegrove的民謠樂隊,幾個禮拜的時間裡,YouTube給我推薦了幾乎所有上傳到它伺服器的這個樂隊的現場演出視訊。當我春天住進一個新公寓的時候,開始越來越多地做飯,在我搜尋了一次如何做義大利麵包沙拉之後,YouTube很快就讓我認識了它的家庭主廚陣營:Byron Talbott、Serious Eats頻道的J. Kenji López-Alt,以及Tasty等等。

YouTube總是很有用,它從2005年創辦以來,就成了網際網路的支柱之一。但在過去的幾年裡,對我來說,YouTube變得出奇地棒。它開始極端準確地預測出我可能感興趣的視訊剪輯是什麼,比它過去所做的要強得多。到底是什麼發生了改變?

在過去的12年時間裡,YouTube已經把自己從一個搜尋驅動的網站轉變成了一個為自己目的服務的網站。要到達自己的目的地,它需要成百上千種嘗試、大量的重新設計,以及在人工智慧方面的巨大飛躍。但真正讓YouTube提升的還是它朝Feed的方向進化。

現在想起來很難記得了,但最開始,YouTube只是一個基礎設施。它提供了一種方便地把視訊植入其他網站的方法,通過這種方法,你最有可能看到這些視訊。隨著網站壯大,YouTube成了一個尋找過期電視節目剪輯的地方,它會隨時跟進最新的午夜喜劇,用來觀看最近的病毒式傳播視訊。和維基百科一樣,YouTube或許也是網際網路上最臭名昭著的地方。你的同事在茶水間提了一句Harlem Shake搞笑視訊,然後你就登入YouTube看了一晚上。

同時,Facebook發明了我們這個時代的標準格式:News Feed,一種根據你的興趣定製的永不間斷的資訊流。Feed佔領了整個消費者網際網路,從Tumblr到Twitter、Instagram和LinkedIn。YouTube早期像個人定製化的發展很有限,它主要是讓使用者去訂閱頻道。這個主意是從電視那裡借用的,它擁有混雜的複雜結果。根據ComScore的資料,在2011年,YouTube一次大規模的推送取得了一些成功,但人均觀看YouTube視訊的時間卻和之前持平。

“頻道”已經不能像以往一樣主宰YouTube了。現在,開啟你手機上的YouTube,你會發現“頻道”被隱藏在了一個單獨的選單裡。取而代之,這個應用會根據你的興趣量身定製一些混合的視訊,並以Feed的形式呈現給你。這些視訊中當然也有你訂閱過的頻道的視訊,但其中也包括和你以前看過的視訊相關的視訊。

這就是為什麼,當直接搜尋了關於《冤罪殺機》視訊之後,我就開始看那些推薦的通關視訊和刻薄評論。YouTube開發了各種工具,讓它的推薦不僅是個人定製化的,還是高度準確的,這些就最終提升了整個網站的觀看時間。

YouTube推薦的技術帶頭人Jim McFadden說:“我們知道,人們來YouTube是來找他們想要的東西,但我們還希望,在人們不知道他們想要找什麼的時候,同樣滿足他們的需求。”McFadden從2011年就加入了這家公司。

我第一次拜訪YouTube也是在2011年,就在McFadden加入這家公司幾個月之後。就是那時候,YouTube開始讓使用者花更多時間來看它們的視訊,現在,這也依然是YouTube的核心目標。在那個時候,事情還進展得並不是非常順利。McFadden說:“YouTube.com作為一個主頁,它並沒有帶來大量的娛樂性。我們就想,好吧,那我們就把讓它具備大量娛樂性作為轉型目的。”

這家公司什麼事情都嘗試了一下:它為頂級的創作者購買了專業的攝像裝置,發起了“leanback”功能,它可以在你觀看視訊的時候,自動排列新的視訊給你。YouTube重新設計了它的主頁,以此強調訂閱頻道,而不是看單獨的視訊。
每個使用者觀看的時長依然持平,但有一個變化出現了,那就是它們的推薦演算法並非基於有多少人點選了視訊,而是基於人們花了多長時間來觀看這些視訊,正是這個變化驅動了接下來那個春天發生的劇變。

幾乎是一夜之間,那些受益於誤導性標題和視訊略縮圖的視訊創作者就看到他們的觀看數字急轉直下。質量較高的視訊往往和更長的觀看時間相關,它們開始急劇上漲。在接下來的三年裡,YouTube的觀看時長每年都增長了50%。

我訂閱了一些頻道,並且自認為是個YouTube的普通使用者。但是它要成為一個一天內多次訪問的目的地,還需要一系列的新工具,那些在過去18個月內成為可能的工具。

當我這個月拜訪YouTube辦公室的實話,McFadden向我介紹了YouTube精確推薦視訊的根源:Google Brain,它是YouTube的母公司Google的人工智慧部門,YouTube從2015年開始使用它。Google Brain並不是YouTube第一次嘗試使用AI,YouTube此前曾把Google建立的Sibyl系統中的機器學習技術應用到推薦演算法中。然而,Google Brain引入了一種見無監督學習的技術,它的演算法能在不同的輸入中尋找到聯絡,這是軟體工程師們從未曾想過的。

McFadden說:“最關鍵的一點是它能夠普及推廣,在此之前,如果我看了一個喜劇的視訊,推薦演算法會說,又有一個人喜歡了這個視訊。但是Google Brain的模型會識別出類似於此的其他喜劇,但又不是完全相同,它們擁有更毗鄰的關係。它能夠識別出不那麼明顯但相似的模式。”

舉個例子,一個Google Brain演算法會給一個移動應用使用者推薦短小的視訊,但給YouTube TV的使用者推薦長一些的視訊。它猜測,根據平臺的不同推薦不同長度的視訊會最終提升觀看時長,它是正確的。YouTube在2016年實施了190多個類似這樣的改變,而今年計劃要做出300個改變。YouTube發現小組的產品經理Todd Beaupre說:“現實就是,它是隨時間推移累積起來的一大批微小的改進。對每一個改進來說,你都要嘗試10件事最終實施一件事。”

Google Brain的演算法比YouTube之前的演算法要更快。公司表示,在過去的幾年裡,一個使用者行為要經過好幾天才會被整合進未來的視訊推薦中,這樣就很難識別出趨勢。Beaupre說:“如果我們希望把使用者吸引過來了解當下在發生什麼,我們就必須修補這個問題,現在,延遲被設定在幾分鐘或幾小時的時間裡,而不是幾天。”

把Google Brain整合到YouTube中有一個重要的影響:人們在YouTube上看視訊的時間,現在有超過70%都來自YouTube的推薦演算法。每一天,YouTube會推薦兩億個不同的視訊給使用者,涉及語言有76種。和三年前相比,人們在YouTube主頁上看視訊的總時長增長了20倍。

這也基本上和我個人的使用者行為相符合。幾年前,我基本上通常只在午飯休息的時候訪問YouTube主頁,一邊吃飯一邊看點什麼。但他們的推薦實在太好了,我開始用更多的空閒時間看視訊。這禮拜,我在PS 4上登入了YouTube,這樣我就能用我最大的螢幕來看它推薦的視訊了。

這就是一個真正強大的個人定製化Feed。對我來說,令人驚訝的是,YouTube對我數字生活的改變比其他任何東西都要強大。Facebook的Feed是基於你的朋友們發了什麼東西,還有你喜歡的主頁發了什麼內容。知道誰訂婚了或者生小孩了很有用處,但除了這些里程碑意義的事件外,我從朋友們發表的內容中沒找到什麼樂趣。Twitter會給你看你關注的人們的推文,還有這些人選擇轉發的東西。作為一個記者,我必須依賴於Twitter,即使有些時候我的時間線真是看似沒有盡頭,充滿了焦慮的吶喊。

每一個Feed都有長度限制,雖然2017年取消了這個限制。在Twitter上,不管你關注誰,關於政治的爭論永遠主宰者討論。Facebook對於“事件”和“團體”這些功能的短暫熱情讓Feed每週都以令人震驚的方式發生變化,這讓我感覺和每一個朋友的連線都更少了。(以圖片為重的Instagram看起來就像一片綠洲,也難怪這個應用還在如此迅速地增長。)

Facebook、Twitter和Instagram,看起來那些Feed都要求人們不斷地為它們表演點什麼。而YouTube很顯然是表演驅動的,但很少一部分使用者會給它上傳視訊,而且YouTube也從來沒有強迫使用者去上傳。YouTube可以被人們被動地享受著,就像它那麼努力地去嘗試取代的電視訊道所做的一樣。在我們這樣一個瘋狂的年代,能不被詢問我們對某個新聞的看法,這真是讓人感到平靜啊。

YouTube對你可能喜歡的相關視訊的強調,意味著它的Feed和其他Feed相比更寬廣,更具有好奇心。它越是尋求不同的內容,就越讓人覺得它在逃離其他Feed的模式。在一個黑暗的時代,我更傾向於選擇YouTube的逃避主義。

在2013年,《大西洋月刊》上有一篇文章,在那篇文章裡,Alexis Madrigal假設我們所知的Feed有其頂峰。他認為,未來會屬於有限的經歷:電子郵件的newsletter、Medium的合集、10集長度的Netflix劇集。畢竟,無窮無盡的資訊流內容讓人感到疲憊。Madrigal說:“當媒體宇宙的秩序被徹底擊敗,自由並不會來填補空白,擁有其自身邏輯的新興秩序將會取代舊的秩序。我們發現資訊流已經展現出它的強迫性和控制性。更快!更多!更快!更多!更快!更多!”

從那四年之後,YouTube的方向只說明瞭Feed模式在變得更重要。一種前所未有的視訊儲存增長,輔以前所未有的個人化定製技術,將會創造出讓人難以拒絕的東西。YouTube現在會調查使用者有多喜愛它們推薦的視訊,長此以往,調查的結果會讓YouTube更加智慧,從而讓更多視訊內容被消費。

Beaupre向我描述了這個過程,說它就像跨越一條鴻溝那樣。“有些內容和你已經喜歡的內容有高度的契合,而有些內容會代表著趨勢和流行的內容,而在這兩者之間,就是充滿魔力的地帶。”如果YouTube的競爭對手找不到跨越這條鴻溝的方式,它們就會發現競爭舉步維艱。

作者|Casey Newton
譯者 | NER
編輯|Emily

AI前線面向AI愛好者、開發者和科學家,提供最新最全AI領域技術資訊、一線業界實踐案例、蒐羅整理業界技術分享乾貨、最新AI論文解讀。每週一節技術分享公開課,助力你全面擁抱人工智慧技術。

image
image

相關文章