個數是如何用大資料做行為預測的？

個推2018發表於2019-01-04

原文網址 : http://blog.itpub.net/31556026/viewspace-2305547/

“個數”是“個推”旗下面向 APP 開發者提供資料統計分析的產品。“個數”通過視覺化埋點技術及大資料分析能力從使用者屬性、渠道質量、行業對比等維度對 APP 進行全面的統計分析。

“個數”不僅可以及時統計使用者的活躍、新增等，還可以分析解除安裝使用者的成分、流向，此外還能實現流失、付費等使用者關鍵行為的預測，從而幫助 APP 開發者實現使用者精細化運營和全生命週期管理。其中很值得一提的是，“個數”在“視覺化埋點”及“行為預測”方面的創新，為 APP 開發者在實際運營中帶來了極大便利，所以，在下文中，我們也將圍繞這兩點做詳細的分析。

視覺化埋點

埋點是指在產品流程的關鍵部位植入相關統計程式碼，以追蹤使用者行為，統計關鍵流程的使用程度，並將資料以日誌的方式上報至伺服器的過程。

目前，資料埋點採集模式主要有程式碼埋點、無埋點、視覺化埋點等方式。

“程式碼埋點”是指在監控頁面上加入基礎 js，根據需求新增監控程式碼，它的優點是靈活，可以自定義設定，可以選擇自己需要的資料來分析，但對複雜網站來說，每次修改一個頁面就得重新出一份埋點方案，成本較大。目前，採用這種埋點方案的代表產品有百度統計、友盟、騰訊雲分析、Google Analytics 等。

“視覺化埋點”通常是指開發者通過裝置連線使用者行為分析工具，直接在資料接入管理介面上對可互動且互動後有效果的頁面元素（如：圖片、按鈕、連結等）進行操作實現資料埋點，下發採集程式碼生效回數的埋點方式。目前，視覺化埋點的代表產品有個數、Mixpanel、神策資料等。

“無埋點”與“全埋點”相似，它的原理是“全部採集，按需選取”，也就是說它可以對頁面中所有互動元素的使用者行為進行採集，它是先儘可能多收集檢測頁面的內容，然後再通過介面配置決定分析哪些資料，但它是標準化採集，如果需要設定自定義的採集方式仍需要程式碼埋點助力。這種方案的代表產品有 GrowingIO、數極客、百度統計等。

“個數”為什麼會選用視覺化埋點？

當下移動網際網路正處於高速發展且發展形勢瞬息萬變的階段中，開發者需要及時根據大資料的分析、反饋，對業務功能等做出調整，在傳統的操作模式中，如果想要了解不同節點的資料，就要修改相應程式碼裡面的埋點，然後測試釋出，之後再在應用商店稽核、上線，整個週期可能長達幾個星期，這顯然無法滿足業務的需求。所以，“個數”採用的“視覺化埋點”技術就是為了幫助開發者解決這個問題的。

“個數”的視覺化埋點靈活、方便，不需對資料追蹤點新增任何程式碼，使用者只需要通過裝置連線管理臺，對頁面可埋點的元素圈圈點點，即可新增隨時生效的介面追蹤點，同時在資料採集模式及資料分析能力上，“個數”能夠提供給開發者們準確的、有效的資料。

視覺化埋點主要具有以下特性：

零程式碼，無需程式碼，節省成本
免更新，新增便捷，無需升級
易測試，圈選測試，實時呈現

換而言之，視覺化埋點不僅可以節約企業成本，還可以提高開發人員和運營人員的工作效率。

行為預測

“個數”的行為預測主要包括流失預測、解除安裝預測、付費預測等，它的原理是基於 App 歷史行為資料構建演算法模型預測使用者關鍵行為，從而幫助開發者達到使用者精細化運營和全生命週期管理的目的。

在這裡需要注意的是，“個數”的行為預測與電商平臺常用的個性化推薦不同，後者主要是基於使用者近期的行為，如瀏覽記錄、購買記錄而分析出使用者可能需要的東西，而“個數”是基於 App 各渠道解除安裝數、解除安裝趨勢等指標的綜合分析，更多的是對人群的聚類分析，而非僅僅基於個人的行為。

行為預測的步驟

據“個推”大資料科學家朱金星介紹，“個數”的行為預測主要分為以下幾個步驟：

1、找樣本，主要從歷史資料庫中抽取；

2、特徵抽取，將使用者與資料庫打通，做匹配；

3、特徵篩選，保留相關性高的或有價值的特徵；

4、模型訓練，將保留下來的特徵放到模型中訓練，在模型的選用上，“個數”主要用了邏輯迴歸，邏輯迴歸的模型相對深度學習等其他模型來說，簡單一些，而且在特徵篩選上相對好處理，得到的結果好解釋，也相對穩定。

5、引數優化，根據效果進行調整，如果結果不理想，即可返回撥整引數重新走一次以上流程。

例項分析

下面我們以付費預測為例，為大家梳理一下具體的實現過程。

個數付費預測的流程主要包括以下幾點：

1、目標問題分解

明確需要進行預測的問題即付費預測，以及未來一段時間的跨度。

2、分析樣本資料

（1）提取出所有使用者的歷史付費記錄；

（2）分析付費記錄，瞭解付費使用者的構成，比如年齡層次、性別、購買力和消費的產品類別等；

（3）提取非付費使用者的歷史資料，這裡可以根據產品的需求，新增條件、或無條件地進行提取，比如提取活躍並且非付費使用者，或者不加條件地直接進行提取；

（4）分析非付費使用者的構成。

3、構建模型的特徵

（1）原始的資料可能能夠直接作為特徵使用；

（2）有些資料在變換後，才會有更好的使用效果，比如年齡，可以變換成少年、中年、老年等特徵；

（3）交叉特徵的生成，比如“中年”和“女性”兩種特徵，就可以合併為一個特徵進行使用。

4、計算特徵的相關性

（1）計算特徵飽和度，進行飽和度過濾；

（2）計算特徵 IV、卡方等指標，用以進行特徵相關性的過濾。

5、選用邏輯迴歸進行建模

（1）選擇適當的引數進行建模；

（2）模型訓練好後，統計模型的精確度、召回率、AUC 等指標，來評價模型；

（3）如果覺得模型的表現可以接受，就可以在驗證集上做驗證，驗證通過後，進行模型儲存和預測。

6、預測

載入上述儲存的模型，並載入預測資料，進行預測。

7、監控

最後，運營人員還需要對每次預測的結果進行關鍵指標監控，及時發現並解決出現的問題，防止出現意外情況，導致預測無效或預測結果出現偏差。

其他場景如流失預測、解除安裝預測等，在流程上與付費預測類似，所以在這裡就不再一一介紹了。

有了精準的行為預測，運營者則可以將運營目標進行拆分、細化，具體到每個場景、每個流程，針對不同使用者採取不同的推廣渠道、運營策略。例如基於流失預測，運營者能夠提前洞察到使用者流失行為，提早進行干預，通過個性化內容推薦、訊息推送等運營手段對即將流失的使用者進行挽留，從而降低流失率。總的來說，在大資料行為預測的幫助下，運營者能夠更及時、更全面地瞭解使用者，從而達到精細化運營的目的。

關於未來

接下來“個數”還將在商品推薦等領域做更多的探索，例如開發精準的推薦技術等，也會不斷挖掘大資料的潛力，結合反饋的資料做進一步的優化，圍繞客戶提供的樣本資料做更深入的訓練學習等，為開發者提供更全面的大資料服務，大家敬請期待。

基於大資料的使用者行為預測
2019-01-02
大資料
如何用XGBoost做時間序列預測？
2020-09-02
什麼是大資料?大資料開發是做什麼的?
2019-12-04
大資料
Python做點選率資料預測
2024-06-18
Python
如何用python做資料分析
2021-09-11
Python
Alex Woodie：2019大資料預測
2019-01-09
大資料
如何用CRM系統做資料分析
2022-09-14
如何用LSTMs做預測？（附程式碼）| 博士帶你學LSTM
2019-03-26
2024 年大資料領域的關鍵預測
2023-12-26
大資料
未來資料分析的五個趨勢預測！
2022-03-02
什麼是大資料測試？大資料測試實現步驟有哪些？
2019-08-29
大資料
視覺化資料用什麼軟體做，大資料視覺化是用什麼做的
2023-02-20
視覺化大資料
如何用Python進行資料分析？
2019-01-15
Python
IPIDEA與大資料，助力電商需求預測
2023-03-13
Idea大資料
如何預測隨機網路的行為
2024-06-24
隨機
如何用大資料解讀流浪漢的生活
2018-10-24
大資料
時間序列資料的預處理及基於ARIMA模型進行趨勢預測-大資料ML樣本集案例實戰
2018-12-10
模型大資料
記錄如何用php做一個網站訪問計數器的方法
2024-04-22
PHP網站
智慧數字經營—分析是如何用資料提高效率
2022-01-13
大資料技術 - 為什麼是SQL
2019-05-14
大資料SQL
汽車行業大資料分析怎麼做？快試試這個資料分析工具，小白也能做
2022-01-28
行業大資料
英靈總數240騎，音源數量約有40000個！ Foley是如何為《FGO》做音效的？
2019-08-20
Go
一個測試用例裡面有多套測試資料，如何用 beautifureport 分別對各組測試資料進行統計測試通過與否
2020-07-28
R資料分析：跟隨top期刊手把手教你做一個臨床預測模型
2021-11-18
模型
做財務資料分析的話，哪個大資料分析平臺更擅長？
2023-05-05
大資料
AI之父：大模型不僅僅是預測下一個符號
2024-05-20
AI大模型符號
什麼是資料運營？資料運營是做什麼的？
2021-12-28
大資料是什麼？大資料的趨勢？
2019-06-22
大資料
大資料開發好還是大資料分析好？哪個薪資高？
2019-06-01
大資料
如何用Postman做介面自動化測試
2020-03-12
Postman
小白可以轉行學習大資料嗎？怎麼做？
2021-09-28
大資料
從零學起到成功轉行資料分析，我是怎麼做的？
2018-06-26
智慧資料時代，機器資料分析五大趨勢預測
2019-02-14
大資料是什麼？華為雲學院帶你探索大資料之旅
2018-10-08
大資料
為什麼學習大資料，大資料專家寫給大資料分析學習者的10個理由
2019-01-13
大資料
darknet是如何對資料集做resize的?
2019-08-03
多智時代，大資料發展趨勢預測
2019-04-09
大資料
大資料預測分析是否對企業有影響
2022-03-02
大資料