如何有效預測移動遊戲首發周的安裝量

Abhimanyu & Victoria發表於2020-09-01
本文來自特約撰稿人 Abhimanyu 和  Victoria。文中所述的測試是他們在 Flaregames 工作期間完成的。

新款遊戲馬上就要釋出了?應用平臺有沒有承諾在商城中給你提供曝光度?想要預測平臺提供的曝光度能帶來多少安裝量?如果你想要精準的數字,那得去問問魔力水晶球。如果你想做個大概的估算,請繼續看下文!

許多遊戲開發者都明顯意識到,通過平臺主推獲得的安裝量已不復當年之多(iOS 平臺更是如此)。但在商城的顯要位置曝光依然能帶來可觀的流量,這些位置是遊戲公司的必爭之地。令人遺憾的是,預測主推周/主推月的安裝量讓很多團隊都感到扎心。不足為奇的是,在對專案營收進行合理預估時,預測安裝量也是專案經理和高管們最重要和最頭疼的工作。每家公司都會通過不同的方法來解決這個問題,大多數公司會根據同類遊戲的安裝量進行預測。但這類方法的準確率往往很低,而且解讀會收到個人觀點的影響。

如何有效預測移動遊戲首發周的安裝量

我們認識到這個問題的困難性且沒有關於這一話題的公開分析,於是打算採用一些科學的方法來解決這個看似很抽象的預測問題。經過認真分析影響潛在客戶安裝決定的關鍵因素後,我們決定測試以下這種假設:遊戲首發周的安裝量與遊戲的主推版位、型別和藝術風格之間存在關係。下面的分析證實了這種假設是正確的。我們希望通過本文為遊戲公司介紹一種能夠付諸實踐的方法,並提供一些相關的研究發現來助力行業獲得進一步發展。

分析方法

與任何同類研究一樣,這套分析方法包含了建立資料集、開展統計測試和建立模型 3 個階段。

具體如下:

  • 分析了在 2018 年 4 月 2 日至 9 月 27 日間主推的 150 多款遊戲
  • 每款遊戲都按主推版位、型別和藝術風格進行分類
  • 採用 Kruskal-Wallis (KW) (1)假設測試來檢驗假設
  • 我們建立了一個線性迴歸模型,將假設遊戲的 3 種變數分類作為輸入,並輸出遊戲在首發周/首發月的預測安裝量範圍

在建立基礎資料集時,我們使用了 App Annie 提供的優質服務來收集相關遊戲的 iOS 自然安裝量估值和主推日期。我們假設遊戲的全球 iOS 主推日期與 iOS 美國主推日期一致。因此,這次分析僅限於 iOS 資料。

擁有大型 IP 的付費遊戲和精選遊戲未納入基礎資料集考量。大型 IP 遊戲包括(但不限於)基於大型電影、電視劇和名人開發的遊戲,以及原創爆款遊戲的續作。值得一提的是,我們在第一輪分析中確實試圖納入大型 IP 遊戲,但逐漸意識到這是一個非常棘手的難題。我們最終得出的結論是,影響大型 IP 遊戲首發周/首發月安裝量的因素數量超出了本次分析的範疇。但我們機會以後建立一個模型來解決這個問題。

變數定義

資料集中的每款遊戲按 3 種變數進行分類,即主推版位、型別和藝術風格。與這些變數相關的賦值例如:

如何有效預測移動遊戲首發周的安裝量

我們採用了 Game Refinery 和 Michail Katkoff (2)制定的遊戲分類法來劃分遊戲型別(見下圖)。例如,“休閒遊戲”是一種遊戲類別,“街機遊戲”是一種遊戲型別,“平臺遊戲”是一種子型別。由於基礎資料集有限且複雜的分類可能無法帶來具有實操性的研究結果,因此資料點分類沒有考慮使用子型別。雖然如此,但應注意到子型別顯然可以在更大的資料集中使用。

如何有效預測移動遊戲首發周的安裝量

驗證假設

我們再提一下初始的假設:遊戲首發周的安裝量與遊戲的主推版位、型別和藝術風格之間存在關係。

我們已使用 Kruskal-Wallis (KW) 假設測試證實上述假設是正確的。我們進一步利用這個假設驗證了首發周的安裝量也存在類似的關係。下表通過 P 值概括反映了各項測試的意義,P 值應小於 0.10 才具有統計學意義。整體而言,每種變數都在各種優勢方面顯示出了統計學意義。我們的研究結論概括如下:

雖然“藝術風格”變數的表現顯然是最弱的,但隨著資料集規模的增加,它與安裝量的關係會變得更強。“型別”變數也是如此。與此同時,我們一定要注意到,顯著的結果與優勢的相關度很高,無論遊戲的優勢是什麼。

接著,我們開展了以下工作:

  • 針對各個變數值建立安裝量範圍
  • 建立模型利用這些不同強度的變數來提供一個關於假設遊戲的首發周/首發月安裝量的定向預測


下圖是首發周安裝量範圍對應的一些變數值。藍色柱條代表平均值,黑色細線代表敏感度範圍。一個有趣的發現是,“大型”主推為首發周帶來的安裝量範圍並不一定會高於“中大型”主推帶來的安裝量範圍,這進一步證明了使用者在決定下載一款遊戲時存在更多的變數。

如何有效預測移動遊戲首發周的安裝量

我們現在能談談未來了嗎?

根據以上分析,下一步顯然是建立模型來對假設/未釋出的遊戲的首發周/首發月安裝量範圍進行定向預測。需要指出的是,150 多款遊戲的基礎資料集並不足以建立穩定的預測模型,但我們可以通過一些務實的方法來嘗試建立一個預測模型。

我們主要嘗試使用 3 種變數作為輸入來建立一個簡單的線性迴歸模型,並使用未納入基本資料集的主推遊戲來進行測試。我們希望測試結果能夠證明建立一個複雜的統計模型是合理的,並且我們很高興看到一些結果能夠證明在這方面投入額外的時間是合理的。下圖是我們的模型預測的首發周安裝量和 App Annie 下載預估提供的實際安裝量的對比:

如何有效預測移動遊戲首發周的安裝量

從上圖可以看出,我們的預測有時準有時不準,平均誤差範圍為 +/-5 萬。導致這種情況的原因有兩個:一是我們的模型設計還比較原始,二是基礎資料集規模較小。可以肯定的是,通過嘗試不同且可能更復雜的統計模型,同時擴大基本資料集的規模,我們的預測精度還能進一步提高。由於我們很容易在這方面過度投入,因此在模型設計的複雜性和時間投入之間找到平衡是關鍵,並且應該由這些定向預測要達到的目標來驅動。

有效預測首發周安裝量的方法

我們通過上述的測試可以看出,遊戲首發周/首發月的安裝量與主推版位、型別和藝術風格之間顯然存在關係。在此基礎上,我們將通過不斷增加資料集、嘗試更復雜的統計模型以及考慮 IP、平臺、主題、應用大小和首發市場等關鍵變數來探尋這些變數之間更緊密的關係。

我們可以很自信地說,在預測遊戲首發周/首發月的安裝量時,應該堅持採用定向預測來估算大概範圍,而不是絞盡腦汁尋找一個準確的數字。希望上述方法和研究結論可以幫助大家更好地制定業務計劃!

註釋:


(1)Kruskal-Wallis (KW) 假設測試
https://en.wikipedia.org/wiki/Kruskal%E2%80%93Wallis_one-way_analysis_of_variance
(2)Game Refinery 和 Michail Katkoff 遊戲分類法
http://www.gamerefinery.com/new-genre-taxonomy-and-why-we-need-it/

更多Facebook出海指南可訪問Facebook專題

相關文章