發現資料異常波動怎麼辦?別慌,指標監控和歸因分析來幫你

袋鼠云数栈發表於2024-03-28

企業搭建完善、全面的指標體系是企業用資料指導業務經營決策的第一步。但是做完指標之後,對指標的監控,經常被大家忽視。當指標發生了異常波動(上升或下降),需要企業能夠及時發現,並快速找到背後真實的原因,才能針對性地制定相應策略,否則就是盲打,原地打轉。

指標異常波動的具體場景,比如:

· 企業關鍵詞的搜尋流量突然降低了,是什麼原因?

· 3月的GMV數字比2月下降了40%,應該如何分析?

· 最近某個品類的訂單數猛增,為什麼?

那麼,本文將詳細介紹如何建立完善的指標異常監控及其對應歸因分析機制,讓大家今後在遇到此類問題時,能夠快速從資料中發現業務問題與機會,提升業務推進速度。

基於統計分析檢測指標異常

企業的日常資料走勢會在一定範圍內上下浮動,但不同的指標其浮動範圍會有差異。當業務在高速增長期,指標每日波動幅度較大;業務在平穩期,指標每日波動幅度則較小;統計粒度越粗,資料量越大,統計結果的波動性也越小。因此,對於不同的指標需要用不同的標準去衡量指標波動是否存在異常。

指標異常監控方法主要有三種:

· 基於實際業務經驗進行閾值設定

· 基於資料結果進行統計分析

· 融入演算法進行建模預測

本文將主要介紹如何基於統計分析方法來評估指標波動是否異常。

統計學中,指標的資料分佈通常滿足正態分佈。正態分佈具有對稱性,會用到均值、標準差兩個資料。其中均值可以反應資料的平均水平,標準差可以反應資料波動幅度,標準差越大, 反映出資料波動性越大。標準差的計算公式如下:

file

利用資料在正態分佈中的位置可以判斷指標波動是否符合預期。在正態分佈中,資料分佈在2倍標準差內的機率是95.5%,在3倍標準差的機率內是99.7%。日常可以使用2倍標準差作為衡量標準。

正常資料結果會在 均值±2* 標準差範圍內浮動,若實際資料超出了這個範圍,則認為本次資料波動異常。

日常資料波動規律會以日、周、月、年為單位出現相同或相似的變化規律,此處以日活指標為例,來說明指標異常波動的監測過程。

某遊戲類APP日活指標通常以周為單位進行資料波動,現計劃基於過去五週的資料走勢來判斷本週一的日活資料是否出現異常波動。

資料準備如下:

file

上述資料的前五週週一的均值:10900,標準差:1507,資料的2倍標準差分別為7887、13913,本週週一資料為7700,在2倍標準差範圍外,則說明本週一日活指標資料波動異常,需要進一步分析異常波動原因,以判斷業務是否真正存在異常。

指標異動歸因分析

指標異動歸因方法有很多,總結起來可以分為兩大類:橫向歸因分析和縱向歸因分析。

橫向歸因分析

橫向歸因分析,指的是對於組合型的指標可以對過程指標做拆分,分析每個過程指標的波動影響因素,再對多個影響因素做整合分析。

如:昨日的付費金額顯著增高。分析增高原因時,先對付費金額做工時拆解:付費金額 = 日活 * 平均付費金額,平均付費金額在正常範圍內波動,日活顯著增加,進一步對相關業務做分析,發現是昨日買量增加帶來的結果影響。

縱向歸因分析

縱向歸因分析,即對指標透過維度下鑽進行歸因分析。維度下鑽分析主要包括兩個分析粒度:一是分析各維度對指標的貢獻程度,二是分析維度值對指標的貢獻程度。

維度的貢獻程度計算可基於每個維度值的貢獻程度彙總得出,而每個維度值的貢獻程度計算有多種計算方式,貢獻程度的計算可以基於預測演算法等多種方法進行。本文介紹一個簡單的基於增長率平均值計算貢獻程度的方法。

單一維度下,每個維度值貢獻程度可透過下列公式計算:

file

下面,以銷售額為例,介紹一下計算過程。

某產品線1月1日和1月2日銷售額分別為3097萬元、3300萬元。細分到城市維度,每個城市兩天的資料表現如下:

file

城市維度中:

file

基於上述步驟即可簡單地實現維度貢獻度及維度值貢獻度的計算。

智慧指標波動監測&智慧歸因分析

在實際的資料場景中,每個維度下維度值的數量少說幾十上百個,多則成千上萬個,每天純手動計算維度貢獻程度將是一個巨大的工作量。分析效率過於低下,導致業務方很容易根據經驗進行結論推斷,如果推斷錯誤,將很有可能產生錯誤決策。

袋鼠雲指標平臺智慧指標波動監測智慧歸因分析功能可以快速、全面的幫助使用者追蹤業務表現,從而進一步推動業務發展。

指標看板檢視

對於企業關注的指標,可以將指標新增到關注看板中進行日常資料觀察與監控。在看板中可直觀檢視所有指標的當前資料表現、近期資料走勢。系統會根據當前資料做智慧診斷,判斷指標波動是否為正常波動,幫助使用者快速定位異常資料,針對性分析與應對資料變化。

file

指標歸因分析

當一個指標結果出現異常時,如果依次對維度、維度值進行歸因分析是一件工作量很大的事情。能夠將分析方法、分析過程系統化,會大大提升歸因分析效率,對業務發展形成極為正向的促進作用。

file

對執行指標歸因分析時,系統會區分維度值計算指標波動情況,進一步計算出維度貢獻度,並根據貢獻度大小進行降序排序,讓使用者聚焦於頭部更重要的影響因素。

在關注的維度下,使用者可以進一步檢視細分維度值的貢獻度,快速發現資料變化原因,透過資料推動業務提升。

點選下方連結可免費試用【指標管理平臺】:
https://www.dtstack.com/easydigit/dataindex?src=szsm

《行業指標體系白皮書》下載地址:https://www.dtstack.com/resources/1057?src=szsm

《數棧產品白皮書》下載地址:https://www.dtstack.com/resources/1004?src=szsm

《資料治理行業實踐白皮書》下載地址:https://www.dtstack.com/resources/1001?src=szsm

想了解或諮詢更多有關大資料產品、行業解決方案、客戶案例的朋友,瀏覽袋鼠雲官網:https://www.dtstack.com/?src=szbky

相關文章