編譯 | AI科技大本營(rgznai100)
參與 | reason_W
不過我們還是儘可能地利用了能拿到手的資料。我和我的前同事Jeremy Rosen花了六個多月的時間來研究Frederator所擁有並運營的頻道資料,想盡可能多地搞明白YouTube的演算法。
關於“觀看時長”,可以參考作者另一篇文章
http://www.tubefilter.com/2016/05/12/youtube-watch-time-metric-algorithm-statistics/
觀看時長
訪問量和訪問速度
訪問時長
啟動會話
上傳頻率
持續會話時間
結束會話
基本上,這些專案中的每一個都關係到你的頻道和視訊表現的好壞:觀眾是不是經常來訪問(開始一次頁面訪問會話),以及他們是不是會停留很長時間。
為了讓你的頻道跟視訊在演算法中累計下任何變數值(譯者注:起碼得讓變數值不為0吧),你首先需要獲取訪問量。為了讓這些視訊“成功”(即在前30天內訪問量實現等於或大於訂閱者的50%的觀眾),你需要在視訊釋出開始的前數分鐘、數小時、數天內獲得大量的訪問次數,我們將其稱為訪問速度。
接下來,我們先來看看兩個變數的作用。
訪問量和訪問速度
根據這個發現,我們進行了一些更深入的挖掘:如果用這個“訪問速度”的規律去預測視訊是否會表現良好,能達到92%的準確率。
其實,視訊的平均累計訪問量和前72小時訂閱使用者訪問百分比的相關性更大。
這些圖和相關性充分表明,“訪問量”和“訪問速度”對於視訊和頻道的整體成功有著直接而重大的影響。
此外,有證據表明,這個影響反過來也很明顯:“訪問速度”低不僅對當前視訊有負面影響,對前一個視訊和後一個視訊也有負面影響。
下面這個圖顯示,如果Frederator上一次上傳的視訊在前48小時內的“訪問速度”低(低的定義是指訂閱使用者訪問百分比不到5%),則下一次上傳也將受到負面影響。
該資料證實了馬修·帕特里克在視訊(https://www.youtube.com/watch?v=HLJQ0gFHM8s)中提到的理論。他的理論表明,如果你的某個視訊沒有被大量訂閱者點選,YouTube就不會賦給你的下一次上傳內容很大的訂閱者推薦比重。或者是因為你的前期上傳工作做得不好,使得頻道的訪問量變低,這反過來會導致分發機制將你的內容分發給更少的觀眾。但不管原因是哪個,悲催的結果是一樣的。
下面的第一張圖表中,藍線是前48小時訂閱使用者訪問量,紅線是前48小時訂閱使用者訪問量與頻道整體訪問量的七天滾動平均百分比。 第二個圖表顯示了當天視訊的訪問次數與頻道整體訪問次數的百分比。
這兩個圖表都表明了一件事:當訂閱使用者訪問你的新上傳視訊和/或頻道庫視訊的百分比下降時,頻道整體訪問次數也會下降。
也就是說,通過這樣的演算法,YouTube會積極推廣那些能吸引該頻道核心觀眾的頻道,同時積極懲罰不能吸引觀眾的頻道。
訪問時長
我們發現,對演算法有重大影響的下一個最大變數是“訪問時長”。訪問時長表示觀眾停留在單個視訊頁面上的時長。
注意:這裡沒考慮視訊持續時間大於8分鐘的視訊資料(因為這樣只要看完視訊,訪問時長就大於8分鐘了)。
我們還發現,訪問時間越長,視訊表現也會更好。
下圖顯示了視訊訪問時長不到五分鐘(1),五分鐘到十分鐘(5)和10分鐘以上(10)的視訊前七天的平均訪問次數:
下圖這張圖也是這個意思,不過從7天拉長到整個生命週期了。
除了這些發現之外,我們還有個不太確定的結論,延長視訊時間能提高訪問資料的表現。
Frederator有一個兒童樂園的頻道,每週會上傳三到四個視訊(時長分別是3分鐘,10分鐘,30分鐘和70分鐘)。我們注意到,即使是上傳頻道庫的一些舊視訊,70分鐘時長視訊的前48小時訪問量也遠遠高於其他視訊。除此之外,70分鐘時長的視訊與該頻道上其他任何時長視訊的平均訪問時長相同。
我們建議他們每週只上傳70分鐘時長的視訊。採取了我們的策略之後,兒童樂園頻道每日的平均訪問次數增加了50萬次,同時在過去6周內的視訊上傳量卻減少了75%。這讓人很驚訝,我知道。
啟動會話,持續會話時間和結束會話
http://www.tubefilter.com/2016/05/12/youtube-watch-time-metric-algorithm-statistics/
這說明了為什麼你的訂閱使用者的前72小時的訪問量如此重要。訂閱使用者是在第一天就可以觀看你的視訊的人。他們也最可能點選該頻道的縮圖,因為他們熟悉你的品牌。
YouTube的演算法關注頻道的推廣效果,而不是個人視訊的效果。
- 能讓人們經常回到平臺
能讓人們長時間停留在平臺上
第二個圖表顯示平均每日訪問次數和頻道的五天滾動訂閱使用者訪問百分比關係。
這意味著如果你能持續地獲得大量使用者啟動會話(五天滾動平均),演算法就會增加你的視訊傳送到該頻道整個視訊庫的日訪問量。
這表明,頻道的持續性和訪問量之間存在相關性,而訪問量又表現為訂閱使用者訪問的百分比。
評分演算法
這裡我們將對這些演算法進行逆向破解,並進行重建。通過15個變數和對其權重的最佳估計,我們建立了一個評分演算法。
這些變數用於開發評分演算法的演算法因子。
下面這些圖是這些因子的實際效果。
下面這張圖展示得更加詳細。
知道你好奇,下面這張圖就是我們對演算法各項變數權重的一個(非常)粗略的估計:
然而,因為沒有更多的資料,我們還不能確定在計算相關性中該使用哪種型別的迴歸。
YouTube通過演算法決定了每個視訊和頻道能獲得多少訪問量。
成功的頻道專注於某個特定的內容型別/想法。
頻道一旦確立起成功的內容型別後,就不應該再進行太多探索。
高價內容製作者在YouTube平臺上永遠不會取得成功,因此這部分群體也絕不會完全接受Youtube。
個性化的節目/頻道將永遠是平臺上的主要內容型別,因為它們就是人們要看的“特定的內容型別”。
新建立的頻道,如果不能從YouTube站外導流進去的話,想要提高訪問量會很不容易。
如果你想在YouTube上取得成功,我們給你的最佳建議是,你應該專注於某個特定群體利益的市場,並儘可能對單個話題製作出長達10分鐘或更長的視訊。
(本文作者Matt Gielen,曾擔任Frederator Networks前副總裁,主管程式設計和觀眾發展。 Matt管理團隊建立了世界上最大的動畫網路——Frederator Networks頻道。此外, 他還領導了團隊進行YouTube上Frederator Networks運營頻道的製作和程式設計。本篇即為其通過資料研究分析的心得體會。)