個數是如何用大資料做行為預測的?
“個數”是“個推”旗下面向 APP 開發者提供資料統計分析的產品。“個數”透過視覺化埋點技術及大資料分析能力從使用者屬性、渠道質量、行業對比等維度對 APP 進行全面的統計分析。
“個數”不僅可以及時統計使用者的活躍、新增等,還可以分析解除安裝使用者的成分、流向,此外還能實現流失、付費等使用者關鍵行為的預測,從而幫助 APP 開發者實現使用者精細化運營和全生命週期管理。其中很值得一提的是,“個數”在“視覺化埋點”及“行為預測”方面的創新,為 APP 開發者在實際運營中帶來了極大便利,所以,在下文中,我們也將圍繞這兩點做詳細的分析。
視覺化埋點
埋點是指在產品流程的關鍵部位植入相關統計程式碼,以追蹤使用者行為,統計關鍵流程的使用程度,並將資料以日誌的方式上報至伺服器的過程。
目前,資料埋點採集模式主要有程式碼埋點、無埋點、視覺化埋點等方式。
“程式碼埋點”是指在監控頁面上加入基礎 js,根據需求新增監控程式碼,它的優點是靈活,可以自定義設定,可以選擇自己需要的資料來分析,但對複雜網站來說,每次修改一個頁面就得重新出一份埋點方案,成本較大。目前,採用這種埋點方案的代表產品有百度統計、友盟、騰訊雲分析、Google Analytics 等。
“視覺化埋點”通常是指開發者透過裝置連線使用者行為分析工具,直接在資料接入管理介面上對可互動且互動後有效果的頁面元素(如:圖片、按鈕、連結等)進行操作實現資料埋點,下發採集程式碼生效回數的埋點方式。目前,視覺化埋點的代表產品有個數、Mixpanel、神策資料等。
“無埋點”與“全埋點”相似,它的原理是“全部採集,按需選取”,也就是說它可以對頁面中所有互動元素的使用者行為進行採集,它是先儘可能多收集檢測頁面的內容,然後再透過介面配置決定分析哪些資料,但它是標準化採集,如果需要設定自定義的採集方式仍需要程式碼埋點助力。這種方案的代表產品有 GrowingIO、數極客、百度統計等。
“個數”為什麼會選用視覺化埋點?
當下移動網際網路正處於高速發展且發展形勢瞬息萬變的階段中,開發者需要及時根據大資料的分析、反饋,對業務功能等做出調整,在傳統的操作模式中,如果想要了解不同節點的資料,就要修改相應程式碼裡面的埋點,然後測試釋出,之後再在應用商店稽核、上線,整個週期可能長達幾個星期,這顯然無法滿足業務的需求。所以,“個數”採用的“視覺化埋點”技術就是為了幫助開發者解決這個問題的。
“個數”的視覺化埋點靈活、方便,不需對資料追蹤點新增任何程式碼,使用者只需要透過裝置連線管理臺,對頁面可埋點的元素圈圈點點,即可新增隨時生效的介面追蹤點,同時在資料採集模式及資料分析能力上,“個數”能夠提供給開發者們準確的、有效的資料。
視覺化埋點主要具有以下特性:
-
1、零程式碼,無需程式碼,節省成本
- 2、免更新,新增便捷,無需升級
- 3、易測試,圈選測試,實時呈現
換而言之,視覺化埋點不僅可以節約企業成本,還可以提高開發人員和運營人員的工作效率。
行為預測
“個數”的行為預測主要包括流失預測、解除安裝預測、付費預測等,它的原理是基於 App 歷史行為資料構建演算法模型預測使用者關鍵行為,從而幫助開發者達到使用者精細化運營和全生命週期管理的目的。
在這裡需要注意的是,“個數”的行為預測與電商平臺常用的個性化推薦不同,後者主要是基於使用者近期的行為,如瀏覽記錄、購買記錄而分析出使用者可能需要的東西,而“個數”是基於 App 各渠道解除安裝數、解除安裝趨勢等指標的綜合分析,更多的是對人群的聚類分析,而非僅僅基於個人的行為。
行為預測的步驟
據“個推”大資料科學家朱金星介紹,“個數”的行為預測主要分為以下幾個步驟:
1、找樣本,主要從歷史資料庫中抽取;
2、特徵抽取,將使用者與資料庫打通,做匹配;
3、特徵篩選,保留相關性高的或有價值的特徵;
4、模型訓練,將保留下來的特徵放到模型中訓練,在模型的選用上,“個數”主要用了邏輯迴歸,邏輯迴歸的模型相對深度學習等其他模型來說,簡單一些,而且在特徵篩選上相對好處理,得到的結果好解釋,也相對穩定。
5、引數最佳化,根據效果進行調整,如果結果不理想,即可返回撥整引數重新走一次以上流程。
例項分析
下面我們以付費預測為例,為大家梳理一下具體的實現過程。
個數付費預測的流程主要包括以下幾點:
1、目標問題分解
明確需要進行預測的問題即付費預測,以及未來一段時間的跨度。
2、分析樣本資料
(1)提取出所有使用者的歷史付費記錄;
(2)分析付費記錄,瞭解付費使用者的構成,比如年齡層次、性別、購買力和消費的產品類別等;
(3)提取非付費使用者的歷史資料,這裡可以根據產品的需求,新增條件、或無條件地進行提取,比如提取活躍並且非付費使用者,或者不加條件地直接進行提取;
(4)分析非付費使用者的構成。
3、構建模型的特徵
(1)原始的資料可能能夠直接作為特徵使用;
(2)有些資料在變換後,才會有更好的使用效果,比如年齡,可以變換成少年、中年、老年等特徵;
(3)交叉特徵的生成,比如“中年”和“女性”兩種特徵,就可以合併為一個特徵進行使用。
4、計算特徵的相關性
(1)計算特徵飽和度,進行飽和度過濾;
(2)計算特徵 IV、卡方等指標,用以進行特徵相關性的過濾。
5、選用邏輯迴歸進行建模
(1)選擇適當的引數進行建模;
(2)模型訓練好後,統計模型的精確度、召回率、AUC 等指標,來評價模型;
(3)如果覺得模型的表現可以接受,就可以在驗證集上做驗證,驗證透過後,進行模型儲存和預測。
6、預測
載入上述儲存的模型,並載入預測資料,進行預測。
7、監控
最後,運營人員還需要對每次預測的結果進行關鍵指標監控,及時發現並解決出現的問題,防止出現意外情況,導致預測無效或預測結果出現偏差。
其他場景如流失預測、解除安裝預測等,在流程上與付費預測類似,所以在這裡就不再一一介紹了。
有了精準的行為預測,運營者則可以將運營目標進行拆分、細化,具體到每個場景、每個流程,針對不同使用者採取不同的推廣渠道、運營策略。例如基於流失預測,運營者能夠提前洞察到使用者流失行為,提早進行干預,透過個性化內容推薦、訊息推送等運營手段對即將流失的使用者進行挽留,從而降低流失率。總的來說,在大資料行為預測的幫助下,運營者能夠更及時、更全面地瞭解使用者,從而達到精細化運營的目的。
關於未來
接下來“個數”還將在商品推薦等領域做更多的探索,例如開發精準的推薦技術等,也會不斷挖掘大資料的潛力,結合反饋的資料做進一步的最佳化,圍繞客戶提供的樣本資料做更深入的訓練學習等,為開發者提供更全面的大資料服務,大家敬請期待。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31556026/viewspace-2305547/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Blab:如何用大資料“預測未來”大資料
- 基於大資料的使用者行為預測大資料
- 預測模型要大資料還是小資料?模型大資料
- 什麼是大資料?大資料開發是做什麼的?大資料
- Python做點選率資料預測Python
- 如何用python做資料分析Python
- 如何用LSTMs做預測?(附程式碼)| 博士帶你學LSTM
- 2015年5個大資料技術預測大資料
- 大資料發展趨勢預測大資料
- 如何用CRM系統做資料分析
- 預測數值型資料:迴歸
- 深度學習,如何用去噪自編碼器預測原始資料?深度學習
- 什麼是大資料測試?大資料測試實現步驟有哪些?大資料
- 未來資料分析的五個趨勢預測!
- 視覺化資料用什麼軟體做,大資料視覺化是用什麼做的視覺化大資料
- Alex Woodie:2019大資料預測大資料
- IPIDEA與大資料,助力電商需求預測Idea大資料
- 2014年是什麼在推動大資料和預測分析?大資料
- 如何預測隨機網路的行為隨機
- 什麼是最小可行性資料產品(MVP)?如何用它做機器學習?MVP機器學習
- 大資料是個什麼鬼啦?大資料
- 大資料技術 - 為什麼是SQL大資料SQL
- 時間序列資料的預處理及基於ARIMA模型進行趨勢預測-大資料ML樣本集案例實戰模型大資料
- 2024 年大資料領域的關鍵預測大資料
- 關於中國大資料市場的十大預測大資料
- 儲存資料的時候,decimal總是把我的小數如2.47儲存成3Decimal
- AI之父:大模型不僅僅是預測下一個符號AI大模型符號
- 汽車行業大資料分析怎麼做?快試試這個資料分析工具,小白也能做行業大資料
- 英靈總數240騎,音源數量約有40000個! Foley是如何為《FGO》做音效的?Go
- 多智時代,大資料發展趨勢預測大資料
- 大資料應用觸發預測性新聞大資料
- 大資料改變經濟預測正規化大資料
- 明年大資料行業的趨勢會是哪些?大資料行業
- 記錄如何用php做一個網站訪問計數器的方法PHP網站
- 智慧資料時代,機器資料分析五大趨勢預測
- 智慧數字經營—分析是如何用資料提高效率
- 大資料是什麼?大資料的趨勢?大資料
- 2015年度大資料發展十大預測大資料