基於大資料的使用者行為預測

個推開發者發表於2019-01-02

隨著智慧手機的普及和APP形態的愈發豐富,移動裝置的應用安裝量急劇上升。使用者在每天使用這些APP的過程中,也會產生大量的線上和線下行為資料。這些資料反映了使用者的興趣與需求,如果能夠被深入挖掘並且合理利用,可以指導使用者的運營。若能提前預測使用者下一步的行為,甚至提前得知使用者解除安裝、流失的可能性,則能更好地指導產品的優化以及使用者的精細化運營。

大資料服務商個推旗下的應用統計產品“個數”,可以從使用者屬性、使用行為、行業對比等多指標多維度對APP進行全面統計分析。除了基礎統計、渠道統計、埋點統計等功能外,個數的一大特色能力是——可基於大資料進行使用者行為預測,幫助運營者預測使用者流失、解除安裝、付費的可能性,從而助力APP的精細化運營以及全生命週期管理。


開發者在實踐的過程中,基於大資料進行使用者行為預測會有兩大難點:第一,開發者需要使用多種手段對目標問題進行分解;第二,資料在特定的問題上會有不同的表現。

“個數”利用資料分析建模,對使用者行為進行預測的大概流程包括以下幾點:

1、目標問題分解

(1)明確需要進行預測的問題;

(2)明確未來一段時間的跨度。

2、分析樣本資料

(1)提取出所有使用者的歷史付費記錄,這些付費記錄可能僅佔所有記錄的千分之幾,資料量會非常小;

(2)分析付費記錄,瞭解付費使用者的構成,比如年齡層次、性別、購買力和消費的產品類別等;

(3)提取非付費使用者的歷史資料,這裡可以根據產品的需求,新增條件、或無條件地進行提取,比如提取活躍並且非付費使用者,或者不加條件地直接進行提取;

(4)分析非付費使用者的構成。

3、構建模型的特徵

(1)原始的資料可能能夠直接作為特徵使用;

(2)有些資料在變換後,才會有更好的使用效果,比如年齡,可以變換成少年、中年、老年等特徵;

(3)交叉特徵的生成,比如“中年”和“女性”兩種特徵,就可以合併為一個特徵進行使用。

4、計算特徵的相關性

(1)計算特徵飽和度,進行飽和度過濾;

(2)計算特徵IV、卡方等指標,用以進行特徵相關性的過濾。

5、選用相關的模型進行建模

(1)選擇適當的引數進行建模;

(2)模型訓練好後,統計模型的精確度、召回率、AUC等指標,來評價模型;

(3)如果覺得模型的表現可以接受,就可以在驗證集上做驗證,驗證通過後,進行模型儲存和預測。

6、預測

載入上述儲存的模型,並載入預測資料,進行預測。

7、監控

最後,運營人員還需要對每次預測的結果進行關鍵指標監控,及時發現並解決出現的問題,防止出現意外情況,導致預測無效或預測結果出現偏差。


以上就是“個數”對使用者行為進行預測的整體流程。總的來說,分析和建模的關鍵在於大資料的收集和對大資料細節的處理。在進行使用者行為預測的整個過程中,可供技術人員選擇的方法和模型都有很多,而對於實際的應用者來說,沒有最好的選擇,只有更合適的選擇。

相關文章