8種流失原因分析法(八):文字挖掘法
前面介紹了7種流失分析方法,本篇將介紹第8種方法:文字挖掘法,利用文字挖掘的技術實現通過聊天記錄分析使用者流失的原因。
一、文字挖掘定義
文字資料探勘(Text Mining)是指從文字資料中抽取有價值的資訊和知識,它是資料探勘的一個分支。文字挖掘中最重要最基本的應用是實現文字的分類和聚類,前者是有監督的挖掘演算法,後者是無監督的挖掘演算法。
二、文字挖掘的資料型別和資料應用
在遊戲行業,可以應用文字挖掘的資料型別主要有:遊戲內聊天記錄,問卷調查主觀題、QQ聊天記錄、微博評論、貼吧評論、TapTap評論、彈幕、視訊評論、appstore應用評論、應用寶、華為等應用市場評論。這些內容中,除了遊戲內聊天記錄,問卷調查主觀題、QQ聊天記錄以外,其他資料需要使用爬蟲自動獲取。
獲取以上這些資料後,可以應用到使用者流失原因分析、使用者內容偏好分析、基於內容的推薦系統、新聞自動聚合、網際網路輿情輿論監控、企業競爭情報系統、基於黑卡、掛機、惡行拉人的反欺詐系統等等。
本篇將通過遊戲內聊天記錄的資料來分析使用者流失原因。
三、聊天記錄可以告訴我們什麼
聊天記錄可以讓我們直接瞭解到遊戲中的熱點話題、玩家情感傾向、玩家來源以及流失原因。有助於運營人員接收到使用者的心聲,精細化掌握玩家需求,發現遊戲內的問題,幫助遊戲進行版本優化,在最大程度上滿足使用者需求。
四、挖掘、分析聊天記錄步驟
本次文字挖掘將使用R語言實現,需要載入Rwordseg包和wordcloud包。實現的步驟如下圖所示,具體的文字挖掘操作,將後續分享。
五、實戰:《遊戲A》聊天記錄分析
《遊戲A》於2013年1月1日公測,其活躍使用者數一路下跌,儘管已經通過遊戲內行為資料分析瞭解到玩家部分流失原因,但是深入瞭解玩家的痛點、癢點、爽點有助於擴大和加深瞭解玩家的流失原因,因此對玩家的聊天記錄進行了分析。
首先,通過R語言對聊天記錄進行分詞,得出遊戲bug、任務、輕功、其他遊戲、好友組隊、不想玩了、負面情緒相關的話題是玩家的熱點話題。
以下就這七個話題對《遊戲A》聊天內容進行分析。整個樣本資料日期為2013年1月1日至 2月6日,樣本數量為27,008,604(話題數)。
1、和遊戲“BUG”相關
遊戲bug對遊戲有潛在的致命傷害,bug話題的監控有助於運營人員及時發現並糾正錯誤,減少玩家的流失。圖 1 為遊戲bug數量與日活躍,可以觀察玩家流失與bug的相關程度。
玩家聊天提到“BUG ”次數較多的時候,正是BUG發生的時候。
開測前兩週,活躍使用者數受BUG影響尤為明顯。
圖1 bug話題數量與日活躍
2、和“任務”相關
在遊戲中做任務可以瞭解遊戲劇情,能給玩家帶來的大量的資源,可以幫助玩家快速的提升自身的實力並且享受更多的樂趣,因此任務的完成情況對玩家的成長非常關鍵。通過玩家聊天中反映的任務問題,有助於我們瞭解玩家在做任務時遇到的問題,從而幫助優化任務,讓玩家遊戲體驗獲得一定的提升。
- 提到”任務”相關話題(見圖2)的人數:25237,總聊天人數:61579,佔比36%。說明任務是玩家聊天的主要討論的話題。
- 反映沒有任務做的玩家人數8799,佔任務話題數的35%。說明沒有引導性的任務對部分玩家來說不太適應。
- 玩家主要提及的任務型別為跑環任務和師門任務:
- 跑環任務:主要討論收白裝、綠裝、鐵錠等物品相關
- 師門任務:主要討論怎麼接,接不了,在哪接(如:為啥我接不到師門任務啊~~~求解/請問誰知道太虛的師門任務在那裡接嗎/請問我到35級以後為什麼還不能接師門任務/求救師門任務接不了才第2環啊)
圖2任務相關話題
3、和“輕功”相關
“輕功”是這款遊戲的一大特色,那玩家的體驗好不好呢?讓我來看看他們的評價。
- 提到“輕功”的話題數6240(見圖3),人數佔總聊天人數5%。
- 85%的玩家認為輕功是遊戲的一大亮點,很好使用;15%的玩家認為用起來不是很爽。
a)正面評價
這個遊戲最好玩的是各種輕功飛來飛去-.-
發現這遊戲的輕功還不錯。馬都可以省了
說真的 我覺得這款遊戲好玩 是因為遊戲的輕功
輕功很爽的
我比較喜歡這遊戲的輕功
輕功我覺得就是亮點 啊
那個輕功水上漂還不錯
不過這遊戲輕功不錯 就是PK沒九陰帶勁
這遊戲輕功非常好玩
我覺得這個輕功是真心的不錯的好技能啊
看來大家很喜歡輕功哇 我朋友說的這是國產遊戲的特點
輕功是不錯,我以前玩的天下貳輕功花錢太多。這裡免費
b)負面評價
還沒九陰輕功爽
話說這遊戲打怪的時候不能用輕功逃跑讓我覺得很不爽的說
輕功消耗體力太快了- -不爽啊
副本不能用輕功表示很不爽
圖3 輕功相關話題
4、和其他遊戲相關
通常,我們瞭解玩家的來源(此處主要指來源哪些外部遊戲)通過問卷調研的資訊得知,然而,根據玩家聊天討論其他遊戲的頻次,我們就能很快判斷哪些是競品遊戲,並定位核心玩家。
- 提到其他遊戲的話題數 11299(見圖4),人數佔總聊天人數8%;
- “魔獸”和“劍靈”的提及次數排名前兩位,分別為3594次、2802次,佔比32%、25% ,可推斷使用者來源主要為這兩款遊戲。
聊天內容:
和魔獸、劍三相關的話題
我感覺這遊戲有魔獸的影子
這個遊戲啊,融合永恆之塔,傳奇,魔獸,征途,就是個大品牌
感覺這遊戲的副本難度不大 至少比劍三和魔獸難度小
比起魔獸,永恆之塔的副本,這副本太沒難度了
我對這個遊戲不太熟悉~我是玩魔獸世界的
技能相對WOW 真少啊
魔獸都比這升級快
感覺這就是中國版的魔獸。
其實劍三就是中國版的WOW
除了 魔獸 劍3 是我玩的最久的遊戲
這個遊戲比劍三好的地方就是人多不會卡
劍三裡面的那個愛的廢墟的歌曲那個劇情真心感人
我怎麼感覺著遊戲有點劍3的感覺呢
這遊戲武魂 輕功 的確不錯的 很多人說抄襲劍3
其實玩過劍3的 都知道 這遊戲輕功是很好的
這個遊戲 滿級很無聊 不像魔獸 劍三 滿級才是開始
圖4 其他遊戲話題
5、和“好友組隊”相關
遊戲的社互動動性影響玩家留存,和好友組隊一起玩遊戲是常見的互動方式,這款遊戲的玩家互動性怎麼樣,參加互動不參與的人的留存有多少差距呢?請看以下分析結果:
- 和好友組隊做任務的帳號數23867(見圖5),好友比例佔總體活躍使用者8%,遊戲B的好友比例為43%。
- 和好友組隊做任務的的使用者14天加權留存率為783%;沒有和好友組隊的使用者為87%好友對使用者留存有重要作用。
說明:聊天日誌中含和好友組隊做好友任務的資料,8%的好友比例僅指和和好友組隊做好友任務的數量。
圖5 加權留存率對比
6、和“不想玩”、“不玩了”相關
聊天記錄中提到“不想玩”、“不玩了”等相關話題的人,流失的可能性很大,找出這些玩家不想玩的原因,可以作為改善遊戲的有效依據。
- 提及“不想玩”、“不玩了”的人數共4003人(見圖6),佔總體聊天人數7% ,其中50級以上玩家佔66%。
- “不想玩”、“不玩了的原因主要有:
任務太多,個別等級沒有任務做,升級不順利;
遊戲BUG太多;
遊戲枯燥;
境界升級失敗概率過高;
升級太累;
朋友不玩了
圖6 其他遊戲話題
不想玩、不玩了的詳細原因:
這遊戲好枯燥的樣子,不想玩了
呵呵就是感覺像玩單機才不想玩的
我都有種不想玩的感覺了- -世界還沒開開了上古都出來了= -
罪惡值高了要17天才能掉就不想玩了
我現在突然不想玩了,感覺每天任務太多了
說真的我不想玩這個遊戲了,每天做任務,沒任務找任務……頭都大了
每天做了師門跑環刷把璇璣就不想玩了。
下了沒任務做怎麼升級啊 不玩了
我還有個40的 就是沒任務了不想玩了
這遊戲全是bug都不想玩了
bug你發現獲利肯定要處理 不然其他玩家都不玩了
我是因為舊服出bug了不想玩,然後玩了幾天lol就膩了……所以一有新服我就回來了
我境界11失敗9次這是我主要不想玩這個的原因
境界10升11 失敗10次了 在失敗者遊戲真心不玩了
就是這個境界導致我不想玩了。
號被扒了 不想玩了
唉,不想玩了,升級太累了
現在我就不想玩了 想升級就得花錢
結果這個遊戲要到80級才能自主程式設計,喜歡程式設計的沒興趣玩升級,升級的不玩程式設計,我程式設計的朋友都不玩了
不改升級太累人很多人都是這麼不玩了
幫會散了,不想玩了,太無聊了
朋友不玩了我也不想玩了
7、負面情緒指數
玩家的負面情緒指數從另一方面反映對一款遊戲的總體滿意度,通過對比發現,這款遊戲的滿意度低於對比遊戲。
- 2月6日,負面情緒人數比例29%(見圖7),遊戲C 23.6%;遊戲B 公測同期為26%
- 開測至今,負面情緒人數比例23%,遊戲B 公測同期為21%
說明:負面情緒人數比例= 負面情緒人數 / 聊天總人數,負面情緒人數:根據負面詞庫(共708個負面詞彙)匹配
圖7 負面情緒指數
主要結論:
《遊戲A》於1月1日進行開放性測試,根據對玩家聊天記錄的分析,有以下主要結論:
1)活躍使用者數受BUG影響較大;
2)任務是玩家聊天討論的主要話題,反映沒有任務做的話題比例為35%,沒有引導性的任務對部分玩家不太適應;
3)85%的玩家認為輕功是遊戲的一大亮點,很喜歡使用;
4)“魔獸”和“劍靈”在被提到的遊戲中排名前兩位,因此推斷使用者來源主要為這兩款遊戲;
5)7%的聊天玩家提到“不想玩”、“不玩了”,其中50級以上玩家佔66%,主要原因:
a)任務太多,個別等級沒有任務做,升級不順利;
b)遊戲BUG太多;
c)遊戲枯燥;
d)境界升級失敗概率過高;
e)升級太累;
f)朋友不玩了
6)負面情緒指數23%,《遊戲B》同期為21%。
建議:因目前遊戲內高等級玩家較多,且部分玩家反映滿級後缺乏可玩性,建議提升遊戲PVP玩法,讓玩家享受更精彩刺激的遊戲體驗。
相關閱讀:
8種流失原因分析法(一):5W1H法
8種流失原因分析法(二):問卷調查法
遊戲流失分析方法3_電話訪談法
遊戲流失分析方法4_流失和留存使用者對比分析法
流失分析方法5_流失前最後一次遊戲行為法
流失原因分析方法6 版本消化情況分析法
8種流失原因分析法(七):排除法
原地址:https://mp.weixin.qq.com/s/XaURR41esAmroSqSxLJB2g
相關文章
- 8種流失原因分析法(七):排除法
- 8種流失原因分析法(二):問卷調查法
- 8種流失原因分析法(一):5W1H法
- 流失原因分析方法6 版本消化情況分析法
- 遊戲流失分析方法4_流失和留存使用者對比分析法遊戲
- CRM系統的四種資料分析法
- 【文字挖掘】(三)文字表示
- 【挖掘篇】:文字分析
- 層次分析法
- 六西格瑪工具之什麼是根本原因分析法(RCA)?
- 杜邦分析法(轉載)
- 比率分析法(轉載)
- JVM 發生記憶體溢位的 8 種原因、及解決辦法JVM記憶體溢位
- 文字挖掘之情感分析(一)
- 文字挖掘的分詞原理分詞
- 三、遞迴樹分析法遞迴
- 層次分析法(轉載)
- 形態分析法(轉載)
- 幕景分析法(轉載)
- PEST分析法繪製軟體免費下載,怎麼畫PEST分析法
- 高階SWOT分析法(轉載)
- 雷達圖分析法(轉載)
- 利潤庫分析法(轉載)
- 流失分析方法5_流失前最後一次遊戲行為法遊戲
- 文字挖掘和文字分析的九大應用場景
- 動態網頁 —— 逆向分析法 + 案例網頁
- 數學建模之層次分析法
- 向豐田學習 “五WHY分析法”
- 風險管理過程分析法(轉載)
- 信用5C分析法(轉載)
- DM8 日誌挖掘
- 5 Why 分析法,一種用於歸納抽象出解決方案的好方法抽象
- 遊戲分析法(三):核心產品決策遊戲
- 資料分析方法中的杜邦分析法
- 層次分析法 插值與擬合
- 常用文字挖掘/NLP 演算法彙總演算法
- 【前端詞典】繼承(二) - 回的八種寫法前端繼承
- 網站流量異常變動的8種常見原因網站