資料洞察

  1、資料介紹

  資料區間是2018年2月1日—5月10日,歷時兩個月,累計260968條。

  採集過程中,對作者做了去重處理,也就是說每個作者只取了他的一條視訊資料。

  這也代表著我們擁有26W個作者的資料。

  資料包含視訊描述、釋出時間、播放數、點贊數、評論數、轉發數、尺寸、清晰度、時長、是否包含商品廣告、是否包含水印,以及視訊作者的暱稱、性別、生日、賬號建立時間、是否認證、認證型別等資料。

  另外,資料均為前端可見資料,未使用任何違規操作。

  2、首次推薦分水嶺是5000,請把贊“刷”到100+

  做過今日頭條自媒體賬號的人應該瞭解,頭條的推薦演算法是先把文章做小範圍推薦,檢視文章在該部分人中的閱讀資料。

  如果閱讀資料良好,則會擴大文章的推薦範圍。資料越好,推薦範圍則越大。

  既然抖音是頭條系產品,那肯定採用了同樣的推薦邏輯。

  從使用者的方便程度來看,點贊>評論>轉發,那麼點贊作為推薦演算法的指標權重應該會大於其他兩個。

  從頭條的推薦演算法推測,視訊應該會先被推薦給一部分使用者,如果點贊數達到某個水平,則會將視訊推薦給更多的人;如果沒有,那麼視訊大概率會涼了。

  經過不斷分段統計視訊各播放量與點贊之間的關係,得到了下面這張表格:

  由於採集機制的原因,我們很難採集到沒有被推薦的視訊,但就現有的1907條播放量在5000以下的視訊我們可以清晰地看到,這些視訊的點贊量100以下的佔到了94%。

  那麼反過來可以推斷,想要你的視訊被更多的人看到(也就是進入系統推薦的二階段),那麼你視訊的點贊量至少應該增加到100以上。

  我做了幾個視訊進行了測試,釋出後分享出去讓好友幫忙點贊(下文會給出方法),那些在1小時內點贊量突破一百的,播放量在幾小時內很快破萬;

  而那些點贊量低的,則不再被人問津。

26萬條抖音資料背後的推薦邏輯以及嚴重失調的男女比例

  即便這個結果在測試中得到了驗證,但是我卻不能給出實錘結論。

  首先,目前採集到的低於5000播放量的資料,大都在5月以後釋出,傳播時間不夠長,或許這恰好是點贊量低的原因;

  其次,與整體的樣本量相比,這部分資料只佔不到1%,沒有達到統計分析的樣本數要求。

  無論如何,視訊的點贊量肯定會作為推薦權重的依據,點贊越高自然是越好的。

  3、看似紅紅火火,但瓶頸似乎已經到來

  作者資料包含了賬號的註冊時間,我把作者的註冊時間按照月份統計,發現抖音使用者的增長似乎在放緩:

26萬條抖音資料背後的推薦邏輯以及嚴重失調的男女比例

  從上面的使用者註冊時間分佈來看,抖音使用者在2018年1月份達到頂峰,隨後開始逐月遞減,4月份已經只有3月份的一半!

  實際上,這個資料仍然存在一些漏洞。

  畢竟存在一種可能,就是新註冊的使用者不喜歡釋出視訊,而是在註冊一段時間後才開始釋出。

  或者,新註冊使用者的視訊因為還未得到系統的推薦,被我們採集到的概率也隨之降低。

  如果賬號的建立時間不能說明問題,我們來看另一組資料。

  把視訊的釋出時間與其相對應的播放量和點贊量結合,我得到了各月釋出視訊的平均點贊量。

  為了去除資料傳播時長的影響,我去掉了5月以後釋出的視訊,得到各月平均點贊量分佈圖:

26萬條抖音資料背後的推薦邏輯以及嚴重失調的男女比例

  資料顯示,各月視訊的平均點贊數在逐月降低,4月份視訊平均點贊量甚至不足3月份的一半。

  或許是因為視訊越來越堵,使用者已經麻木,但無論如何,早期的紅利在逐漸降低,想上車的要趕緊了。

  4、拍滿15s不是最好的,10s更受使用者歡迎

  目前抖音未公佈獲得視訊超過15s時長許可權的機制,但至少我們知道“優質”是選拔的重要條件,所以在分析視訊時長時,我去掉了時長超過15s的視訊。

  對15s以內視訊的平均點贊情況作了分析,得到以下分佈圖:

26萬條抖音資料背後的推薦邏輯以及嚴重失調的男女比例

  資料並不支援我們把視訊拍滿15s,10s是最好的,13s也不錯,甚至11s都優於15s。

  由於超過15s的視訊數量僅6866條,在樣本中佔比太少,我就不再給出分析。在相同數量級下(均少於100條),39s、42s、50s和58s看上去效果不錯。

  5、男女比例嚴重失調,小哥哥的視訊更受歡迎

  統計26W個作者的性別,我發現抖音使用者中女性使用者數量接近男性的3倍!

  顯然是嚴重失調。

26萬條抖音資料背後的推薦邏輯以及嚴重失調的男女比例

  (注:“無”代表使用者沒有填寫性別資訊)

  從使用者組成來看,就很容易理解為什麼抖音的帶貨能力這麼強了。

  從購物能力來看,女性購買力更強,畢竟大部分錢都掌握在女性的手裡。

  把作者性別和其釋出視訊的平均點贊量結合,我神奇的發現,小哥哥們的視訊竟然更受歡迎!

26萬條抖音資料背後的推薦邏輯以及嚴重失調的男女比例

  難不成是因為女性使用者多於男性,異性相吸?

  注:沒有性別資訊的使用者有多個視訊點贊量超過百萬(比如使用者@安德羅妮、的一個視訊點贊量達到600W),造成了該類別使用者的平均點贊量過高,不排除這部分使用者均為女性的可能性。

  6、生活化的內容是抖音的主流,年輕人願意表達愛與喜歡

  使用新浪微輿情的文字分析功能,把視訊的描述文字做了詞性和情感方面的分析,發現生活化的內容是抖音的主體。

26萬條抖音資料背後的推薦邏輯以及嚴重失調的男女比例

  對視訊描述文字的詞性分析,動詞方面除了“喜歡”和“愛”以外,生活化的“想”、“拍”、“吃”是出現頻率最高的詞;

  形容詞方面“快樂”、“開心”、“好看”和“可愛”是抖音使用者最喜歡錶達的感情;

  名詞上“小哥哥”和“小姐姐”顯然已經成為發抖音的固定搭配。

26萬條抖音資料背後的推薦邏輯以及嚴重失調的男女比例

  整體詞頻方面,除了“小哥哥”、“小姐姐”以及“抖音小助手”以外,具備強烈生活色彩的“爸爸”、“我媽”、“弟弟”、“老公”、“我家”這些詞同樣被高頻率使用。

  2

  福利:一些抖音小技巧

  1.精細化運營,一些小細節很重要

  我們來看下面兩個視訊截圖,你發現什麼差別了麼?

26萬條抖音資料背後的推薦邏輯以及嚴重失調的男女比例

  如果兩個視訊都需要視訊描述來完善視訊的內容,那麼後一個視訊的效果會更好,因為相比於白色視訊背景,純黑色可以非常清晰的把底部的視訊描述凸顯出來。

  除此以外,視訊內容和質量相似的情況下,豎向的視訊比橫向的視訊更容易被點贊,不信你橫過手機點贊一下試試……

  2.能不能繞過機器篩選直接被推薦到更大的流量池?

  隨著監管制度的完善,純機器演算法篩選和推薦已經不能滿足使用者對高質量內容的需求,於是今日頭條引入了大量人工稽核團隊。

  這些人工除了稽核內容是否違規外,還承擔發現優質內容、使其提前進入推薦佇列的職責(我猜的)。

  如果我猜對了,那麼,如果視訊能跨過機器的迭代推薦,直達人工,豈不是會更快速的火起來?

  這個方法就是在視訊描述里加入一些機器識別不準確的敏感詞,你們如果膽大可以試一試。

  你現在在抖音中還會點贊嗎?

  歡迎評論區留言,與大家分享哦。