遊戲資料分析練習

在逃扇貝發表於2020-11-14

理解資料


本次測試集資料共828934條,109個欄位
主要對於以下10個欄位進行分析

欄位解釋
user_id玩家唯一id
pay_price付費金額
rigister_time玩家註冊時間
avg_online_minutes線上時長
pvp_battle_count玩家之間對戰次數
pvp_lanch_count主動發起pvp次數
pvp_win_countpvp勝利次數
pve_battle_count玩家-電腦之間的對戰次數
pve_lanch_count玩家主動發起PVE次數
pve_win_countpve勝利次數

主要從以下四個方面進行分析

  • 新增玩家分析:玩家數量,付費玩家佔比,每日新增
  • 玩家活躍度分析:線上時長,分佈特徵
  • 付費情況分析:PUR,ARPPU,ARPU等關鍵指標情況分析
  • 遊戲習慣分析:從PVP,PVE兩個指標情況進行分析

資料分析


1.新增玩家分析

  • 1.1新增玩家數量
SELECT count(DISTINCT user_id)
FROM tap_fun_test

在這裡插入圖片描述

  • 1.2付費玩家數量
SELECT count(DISTINCT user_id) 新增付費玩家
FROM tap_fun_test
WHERE pay_price>0

在這裡插入圖片描述

  • 1.3付費玩家佔比
SELECT b.`新增付費玩家`/a.`新增玩家` AS 付費玩家佔比
FROM
(SELECT count(DISTINCT user_id) 新增玩家
FROM tap_fun_test) a,
(SELECT count(DISTINCT user_id) 新增付費玩家
FROM tap_fun_test
WHERE pay_price>0)b

在這裡插入圖片描述
新增玩家共828394人,付費玩家有19549人,付費人數佔註冊總人數2.36%

  • 1.4每日新增使用者數量
SELECT date(register_time) as 日期,
count(DISTINCT user_id) as 當日新增玩家
FROM tap_fun_test
GROUP BY date(register_time)

在這裡插入圖片描述

  • 1.5每日新增付費使用者數量
SELECT date(register_time) as 日期,
count(DISTINCT user_id) as 當日新增付費玩家
FROM tap_fun_test
WHERE pay_price>0
GROUP BY date(register_time)

在這裡插入圖片描述
資料視覺化:
在這裡插入圖片描述
由圖可得:

每日新增玩家數在3.10日有一次大高峰增長,3.13一次小高峰增長,是由於兩個時間點舉辦了遊戲活動,但是遊戲活動過了以後,後續註冊量沒有顯著提升。

活動需要保持力度與一定時間維度,給玩家充分的時間去了解遊戲。

2.玩家活躍度分析

  • 2.1平均線上時長
SELECT AVG(avg_online_minutes)
FROM tap_fun_test

在這裡插入圖片描述

  • 2.2付費玩家平均線上時長

SELECT AVG(avg_online_minutes)
FROM tap_fun_test
WHERE pay_price>0

在這裡插入圖片描述
明顯得出:付費玩家平均線上時長遠遠大於全體玩家平均值

  • 2.3平均線上時長分佈特點
#求全部玩家四分位
SELECT ROUND(COUNT(DISTINCT user_id)/4) AS 下四分位數,
ROUND(COUNT(DISTINCT user_id)/2) AS 中位數,
ROUND(COUNT(DISTINCT user_id)/4*3) AS 上四分位數
FROM tap_fun_test

在這裡插入圖片描述
207234 414467 621701

#求全部玩家線上時長的關鍵值
SELECT MIN(avg_online_minutes+0) as 最小值,
(SELECT avg_online_minutes
FROM tap_fun_test
ORDER BY avg_online_minutes+0
LIMIT 207234,1) AS 下四分位數,
(SELECT avg_online_minutes
FROM tap_fun_test
ORDER BY avg_online_minutes+0
LIMIT 414467,1) AS 中位數,
(SELECT avg_online_minutes
FROM tap_fun_test
ORDER BY avg_online_minutes+0
LIMIT 621701,1) AS 上四分位數,
MAX(avg_online_minutes+0) as 最大值
from tap_fun_test

在這裡插入圖片描述
0 0.5 1.666667 5.0 1605.833333

#付費玩家遊戲時長四分位
SELECT ROUND(COUNT(DISTINCT user_id)/4) AS 下四分位數,
ROUND(COUNT(DISTINCT user_id)/2) AS 中位數,
ROUND(COUNT(DISTINCT user_id)/4*3) AS 上四分位數
FROM tap_fun_test
WHERE pay_price>0

在這裡插入圖片描述

4887 9775 14662

#付費玩家遊戲時長關鍵值
SELECT MIN(avg_online_minutes+0) as 最小值,
(SELECT avg_online_minutes
FROM tap_fun_test
WHERE pay_price>0
ORDER BY avg_online_minutes+0
LIMIT 4887,1) AS 下四分位數,
(SELECT avg_online_minutes
FROM tap_fun_test
WHERE pay_price>0
ORDER BY avg_online_minutes+0
LIMIT 9775,1) AS 中位數,
(SELECT avg_online_minutes
FROM tap_fun_test
WHERE pay_price>0
ORDER BY avg_online_minutes+0
LIMIT 14667,1) AS 上四分位數,
MAX(avg_online_minutes+0) as 最大值
from tap_fun_test
WHERE pay_price>0

在這裡插入圖片描述
0.333333 30.666666999999997 84.666667 191.333333 1081.5

將資料視覺化:
在這裡插入圖片描述
由圖可得:
百分之75的玩家平均線上時長只有5分鐘以內,可見玩家流失情況較嚴重。
付費玩家的線上時長下四分位數為30.6,所以可見百分之75以上的付費使用者時長平均線上時長超過30分鐘

3.玩家付費情況分析

關鍵指標:

AU:活躍使用者 遊戲時長>15分鐘
PU:付費使用者
APA:活躍付費使用者數
ARPU:平均活躍使用者收入
ARPPU:平均每個活躍付費使用者收入
PUR:付費比率 APA/AU

3.1 ARPU 平均活躍玩家收入

SELECT COUNT(DISTINCT user_id) as 活躍玩家數量,
SUM(pay_price) as 活躍玩家總付費,
FORMAT(SUM(pay_price)/COUNT(DISTINCT user_id),2) as ARPU
FROM tap_fun_test
WHERE avg_online_minutes>=15

在這裡插入圖片描述

3.2 ARPPU 平均每個活躍付費玩家收入

SELECT COUNT(DISTINCT user_id) as 活躍付費玩家數量,
SUM(pay_price) as 活躍付費玩家總付費,
FORMAT(SUM(pay_price)/COUNT(DISTINCT user_id),2) as ARPPU
FROM tap_fun_test
WHERE avg_online_minutes>=15 AND pay_price>0

在這裡插入圖片描述

3.3 PUR:付費比率 APA/AU


SELECT COUNT(DISTINCT user_id) as APA,
(SELECT count(DISTINCT user_id) 
FROM  tap_fun_test
WHERE avg_online_minutes>=15) AS AU,
COUNT(DISTINCT user_id)/(SELECT count(DISTINCT user_id) 
FROM  tap_fun_test
WHERE avg_online_minutes>=15) AS PUR
FROM tap_fun_test
WHERE avg_online_minutes>=15 AND pay_price>0

在這裡插入圖片描述
將資料視覺化:
在這裡插入圖片描述
在這裡插入圖片描述
由圖可得:該遊戲人均付費率很低,遊戲收入表現較差
但是根據第二張圖,ARPPU是ARPU的六倍,說明玩家付費能力強,可以做一些付費的優化,讓人民幣玩家玩的開心愉快

相關文章