基於大資料的使用者行為預測
隨著智慧手機的普及和APP形態的愈發豐富,移動裝置的應用安裝量急劇上升。使用者在每天使用這些APP的過程中,也會產生大量的線上和線下行為資料。這些資料反映了使用者的興趣與需求,如果能夠被深入挖掘並且合理利用,可以指導使用者的運營。若能提前預測使用者下一步的行為,甚至提前得知使用者解除安裝、流失的可能性,則能更好地指導產品的優化以及使用者的精細化運營。
大資料服務商個推旗下的應用統計產品“個數”,可以從使用者屬性、使用行為、行業對比等多指標多維度對APP進行全面統計分析。除了基礎統計、渠道統計、埋點統計等功能外,個數的一大特色能力是——可基於大資料進行使用者行為預測,幫助運營者預測使用者流失、解除安裝、付費的可能性,從而助力APP的精細化運營以及全生命週期管理。
開發者在實踐的過程中,基於大資料進行使用者行為預測會有兩大難點:第一,開發者需要使用多種手段對目標問題進行分解;第二,資料在特定的問題上會有不同的表現。
“個數”利用資料分析建模,對使用者行為進行預測的大概流程包括以下幾點:
1、目標問題分解
(1)明確需要進行預測的問題;
(2)明確未來一段時間的跨度。
2、分析樣本資料
(1)提取出所有使用者的歷史付費記錄,這些付費記錄可能僅佔所有記錄的千分之幾,資料量會非常小;
(2)分析付費記錄,瞭解付費使用者的構成,比如年齡層次、性別、購買力和消費的產品類別等;
(3)提取非付費使用者的歷史資料,這裡可以根據產品的需求,新增條件、或無條件地進行提取,比如提取活躍並且非付費使用者,或者不加條件地直接進行提取;
(4)分析非付費使用者的構成。
3、構建模型的特徵
(1)原始的資料可能能夠直接作為特徵使用;
(2)有些資料在變換後,才會有更好的使用效果,比如年齡,可以變換成少年、中年、老年等特徵;
(3)交叉特徵的生成,比如“中年”和“女性”兩種特徵,就可以合併為一個特徵進行使用。
4、計算特徵的相關性
(1)計算特徵飽和度,進行飽和度過濾;
(2)計算特徵IV、卡方等指標,用以進行特徵相關性的過濾。
5、選用相關的模型進行建模
(1)選擇適當的引數進行建模;
(2)模型訓練好後,統計模型的精確度、召回率、AUC等指標,來評價模型;
(3)如果覺得模型的表現可以接受,就可以在驗證集上做驗證,驗證通過後,進行模型儲存和預測。
6、預測
載入上述儲存的模型,並載入預測資料,進行預測。
7、監控
最後,運營人員還需要對每次預測的結果進行關鍵指標監控,及時發現並解決出現的問題,防止出現意外情況,導致預測無效或預測結果出現偏差。
以上就是“個數”對使用者行為進行預測的整體流程。總的來說,分析和建模的關鍵在於大資料的收集和對大資料細節的處理。在進行使用者行為預測的整個過程中,可供技術人員選擇的方法和模型都有很多,而對於實際的應用者來說,沒有最好的選擇,只有更合適的選擇。
相關文章
- 基於使用者行為的圖片等資源預載入
- 個數是如何用大資料做行為預測的?大資料
- 時間序列資料的預處理及基於ARIMA模型進行趨勢預測-大資料ML樣本集案例實戰模型大資料
- 關於中國大資料市場的十大預測大資料
- 基於網站的使用者行為分析網站
- 基於使用者位置資訊的行為分析
- 【大資料之網站使用者行為分析】大資料網站
- 基於資料預測的解釋真的能增加使用者對人工智慧的信任嗎?(附連結)人工智慧
- 基於flink的電商使用者行為資料分析【3】| 實時流量統計
- 為什麼說基於機器學習的AI預測更智慧?機器學習AI
- 求助,關於web使用者行為資料採集Web
- 基於flink的電商使用者行為資料分析【4】| 惡意登入監控
- 基於使用者畫像大資料的電商防刷架構大資料架構
- 基於大資料的使用者畫像構建(理論篇)大資料
- 基於使用者行為的視訊聚類方案聚類
- 基於Kerberos的大資料安全方案ROS大資料
- Kika:全球使用者Emoji使用行為大資料包告大資料
- 使用者行為資料集
- 預測模型要大資料還是小資料?模型大資料
- 大資料發展趨勢預測大資料
- 基於flink的電商使用者行為資料分析【2】| 實時熱門商品統計
- 以Lgwr Worker為例,基於Strace 分析 Oracle 資料庫行為的方法Oracle資料庫
- Dotnet core基於ML.net的銷售資料預測實踐
- 大資料元件-Hive部署基於MySQL作為後設資料儲存大資料元件HiveMySql
- IDC關於資料中心的十大預測
- 關於“使用者資料大裸奔”
- 基於Spark對消費者行為資料進行資料分析開發案例Spark
- 大資料workshop:《線上使用者行為分析:基於流式計算的資料處理及應用》之《實時資料分析:海量日誌資料多維透視》篇大資料
- 基於工業資料的檢測分析
- 基於大資料的消費者洞察大資料
- 基於Hive的大資料分析系統Hive大資料
- 專家觀點∣基於資料驅動的裝置預測性維護
- 4大維度3大預測,基於容器生態擴張的DevSecOps為啥引關注?dev
- 機器學習增強的電子商務平臺使用者行為預測機器學習
- 基於機器學習預測Airbnb的城市旅行成本機器學習AI
- 機器學習演算法(五):基於企鵝資料集的決策樹分類預測機器學習演算法
- 基於蛙跳最佳化的神經網路資料預測matlab模擬神經網路Matlab
- 基於 kafka 的日誌資料建模測試Kafka