什麼設計讓遊戲熱度更久?來自門限迴歸模型的觀點

abraxas71發表於2020-05-15
什麼設計讓遊戲熱度更久?來自門限迴歸模型的觀點


宣告:abraxas71投稿,轉載需經作者本人同意

我力求客觀,但絕不冷漠

——賴特·米爾斯


在遊戲開發過程中,我們關心什麼樣的遊戲設計對專案表現有正面影響。不幸的是,這種關心多數停留在猜想、模仿近期出現在媒體排行榜上的成功案例。前者表現在系統策劃案裡諸如提高使用者活躍、黏性、留存、付費等名詞套話中,後者僅模糊的存在正相關但哪怕同一公司也失敗於模仿自己的前作。從業經驗有時起作用,卻受限於專案開發週期的反饋過長、職能等級與個人之見。

本文從資料分析的角度嘗試回答上述問題,在此之前說明一些背景是有趣的。本文主要受了兩方面的影響,一個是賓夕法尼亞大學的沃頓商學院經濟學家Ethan Mollick在2011年發表的論文《People and Process, Suits and Innovators The Role of Individuals in Firm Performance》,論文使用了計量經濟學方法考察了遊戲在盈利上的成敗與開發人員職能的關係,發現製作人由於整合、協調遊戲設計師們的工作從而影響或貢獻更大,表現在遊戲設計人員的影響不到製作人的三分之一。另一個是前谷歌資料科學家賽思·斯蒂芬斯的著作《人人都在說謊》,書中用資料有力的闡明瞭一個觀點:人們面對搜尋引擎沒有說謊、粉飾自己的動機。這使得賽思·斯蒂芬斯從谷歌趨勢中發現了人們的言不由衷、誇大其詞和藏匿的陰暗心理,如對伴侶的負面評價而非社交媒體上的正面展示、支援對外強硬的川普所在的州與種族歧視搜尋地區的高度吻合等等。

起初,本文作者僅仿效賽思·斯蒂芬斯從谷歌趨勢中得到有趣發現的方式,從百度指數、

360趨勢、搜狗指數裡隨意查詢一些關鍵詞,比方說新冠疫情讓臨時抱佛腳去鍛鍊的人提高了至少一倍、中國女生對男朋友的標準強烈受韓劇的影響、中國男生則沉溺於小說和虛擬遊戲的愛情裡不可自拔同時苦惱於如何和女生聊天。由於本文作者隸屬於遊戲行業的數值策劃崗位,所以也搜尋了商業遊戲,這些商業遊戲都有一個高峰搜尋量然後趨於穩定,但許多遊戲的高峰時間跨度非常相似,另一部分遊戲的時間跨度則明顯更長。相似跨度的遊戲似乎與業界劃分的遊戲型別、黑馬與否關係並不大,比如刀塔傳奇、陰陽師、皇室戰爭、絕地求生,它們的高峰持續時間相似的窄,而高峰跨度表現更長的有三國殺、爐石傳說、lol、英魂之刃。於是作者提出了一個假設來區分這兩類遊戲:

1)研發牽引型。遊戲主體玩法要求玩家儘可能投入時間成本,玩法欠缺時間不長的迴圈的、週期反饋,如陰陽師、刀塔傳奇。或即便存在迴圈、週期的反饋,過程中也沒有放鬆、緊張的交替性,而是要保持精神專注,如絕地求生、皇室戰爭雖然遊戲是一局一局進行的但持續緊張並頻繁的做出重要決策。

2)玩家可控型。遊戲主體玩法較少的要求玩家持續投入時間才可獲得獎勵和防止落後,存在時間不長的迴圈的、週期反饋,並且過程中玩家可以放鬆神經而非始終保持專注,如三國殺與爐石傳說在他人行動時是放鬆的、lol的大規模團戰並不頻繁發生且存在時不時的打野、打金空隙及匹配模式。

任何模型都是對現實世界的比喻和簡化,且做出了一定假設。上述將觀察法得到的兩類遊戲編碼為“研發牽引型”和“玩家可控型”是一種假設,使用百度指數的搜尋指數資料也是一種假設,我們假設搜尋指數表達了對特定遊戲的關注或這個遊戲的熱度。既然這些遊戲有一個凸起的高峰然後趨於平穩,我們可以把高峰持續的時間、平穩期搜尋量除以高峰期搜尋量作為二次分析的資料,來考察是否的確研發牽引型遊戲熱度表現要弱於玩家可控型,換句話說更易使玩家疲憊、熱情減退。

搜尋指數是時間為標籤,每個時間對應1個數值,所以它是典型的時間序列資料,需要運用時間序列的處理方法。而高峰期是一個模糊的概念,觀察法還不夠,我們使用門限迴歸找到高峰期的時間跨度。門限迴歸是使用多段線性逼近非線性的統計模型,它在預測的穩健性上要好於不少非線性模型如多項式擬合,根據自變數是否跨過一個門限值來決定使用哪個線性方程,所以,這個門限值對應的時間標籤就能幫助我們找到何時高峰開始、何時高峰結束進入平穩期,兩者時間相減即是時間跨度。門限迴歸的一個難點是到底分出多少段是合適的,我們使用MCP(極大極小非凸罰函式)自動篩選,MCP是一種漸進無偏的稀疏懲罰函式,估計出的模型和真實的模型別無二致,稱呼為oracle性質,它能確切的將回歸係數估計為0來識別一個多餘的分段。

我們用TRM建模(門限迴歸)。其殘差平方和模型為:
什麼設計讓遊戲熱度更久?來自門限迴歸模型的觀點



Φ為近似示性函式的標準正態分佈函式,使得門限迴歸的不同分段可以組成一個連續的函式求解,示性函式用來判斷自變數z是否大於門限值c進而選取不同的線性方程,由於是以時間為變數做迴歸,所以z和c事實上都是某個時間點。M表示分段數,p(θ)為MCP懲罰函式,它會自動懲罰不同段但迴歸係數θ相同的線性迴歸方程合併成一個方程來減少M,其表示式為:


什麼設計讓遊戲熱度更久?來自門限迴歸模型的觀點


γ是調節引數,λ為懲罰因子。

我們使用github開源的爬蟲程式碼爬取了如下游戲的搜尋指數:

研發牽引型:刀塔傳奇,太極熊貓,陰陽師,皇室戰爭,絕地求生,魔靈召喚,少年三國志,不思議迷宮,明日之後,碧藍航線,奇蹟暖暖,戀與製作人。

玩家可控型:lol,王者榮耀,三國殺,英魂之刃,夢三國,小米超神,自由之戰,英雄殺,爐石傳說,部落衝突。

爬取的時間終點全部為2020-04-30,爬取的起點則依據肉眼觀察和遊戲上線時間,儘可能囊括明顯高峰前的小段直線距離。本文判斷高峰的標準是以門限迴歸的後一個線性方程的斜率減去前一個的斜率,選取差額的最大值和最小值視為高峰的開始和結束,兩者相減即為高峰保持時間。然而擬合時發現,不論如何選取懲罰因子、M以及檢查程式碼邏輯(含使用模擬資料驗證演算法正確性),均不能擬合成功,尤其是不能正確擬合高峰。經仔細分析,證明是因為模型中的作為窗寬的h過大導致,根據Seoy和Lintonz 的論文《A smoothed least squares estimator for threshold regression models.》指出,h趨於0,在樣本趨於無窮大時,標準正態分佈函式可近似示性函式。於是本文作者改寫了h的計算方法,使之更趨於0。以下是部分遊戲的擬合圖:

明日之後


什麼設計讓遊戲熱度更久?來自門限迴歸模型的觀點


高峰起始於2018-10-29,結束於2018-11-30

王者榮耀


什麼設計讓遊戲熱度更久?來自門限迴歸模型的觀點


高峰起始於2015-10-04,結束於2018-11-05

橫軸為時間,時間是以次序取值,縱軸為標準化後的搜尋指數,標準化用以減少量級加快求解速度。以下是所有遊戲的高峰起始與結束時間及差額:

什麼設計讓遊戲熱度更久?來自門限迴歸模型的觀點



門限迴歸選取出的高峰起始、結束時間點,通過觀察搜尋資料能夠發現是合理的。雖然與肉眼觀察的結果相對一致,但使用該方法有助於統一標準。圖中可見使用了方差不齊的獨立樣本t檢驗,t檢驗是一種比較穩健的統計檢驗,並且t統計量也具有衡量效果差異程度的作用,一般超過0.8就是效果大,對高峰持續時間的p值檢驗也表明差異顯著。我們用平穩期的均值除以高峰期的均值來消除遊戲之間搜尋指數量級之間的差別,得到的值表示這些遊戲的“退熱”大小,t檢驗表明差別不顯著,但對效果量而言,1.5是相當大的效果差距。換言之,統計分析不僅證實了觀察猜測的熱度保持時間兩類遊戲存在差別,而且兩類遊戲的抗熱度衰退也存在效果量評價角度的差別。

基於上述分析我們發現,一個牽引著玩家駐留在遊戲裡的遊戲,不論其型別如何、是否被行業捧為黑馬,並不能達到讓玩家保持“黏性”的目標,且就平穩期而言的熱度對比高峰期,衰退的也更為劇烈。相比之下,那些沒有太多要求玩家投入的、有周期完結成就感的遊戲設計更加細水長流,在保持玩家熱情方面,平穩期的表現也更出色。但必須承認,不論使用多少統計分析手段,也只能證明兩類遊戲的高峰熱度時間長度、抗熱度衰退上存在差距,卻不能明確證明差距的原因,我們只是假設低熱度保持的遊戲是玩家付出太多成本、保持緊張導致了疲倦,這是觀察資料天生的缺陷——不是通過操縱自變數得到,但本文還是嘗試性的邁出用資料分析遊戲設計結構好壞的第一步。

我們在此帶著一份質疑結束:專案失敗總會發生、玩家熱情總會減退,而面對眾多的資料,遊戲行業的人們卻甚少發展和使用理性的方法加以認識,幻想著可以坐在高背椅裡抓住事物的模式,現實反覆證明,這種方式收效甚微。

巴比倫派數值策劃Q群:813299364

相關文章