資料分析中最缺少的是資料探索工具?

banq發表於2022-02-23

如果您在工作中與業務資料進行互動,您可能會想:如今擁有大量資料和分析工具,為什麼仍然很難回答最重要的業務問題?

傳統的商業智慧 (BI) 甚至更新的產品分析工具都可以很好地回答報告問題,例如:每天訪問我的網站/應用程式的使用者數量是多少?但是,它們並不能很好地擴充套件到更深層次的問題,例如:為什麼上個月收入停止增長?我們如何才能提高使用者轉化率?這些是企業真正追求的可操作問題。

今天的分析工具是針對問題是“什麼”而構建的,通常無法回答更多開放式的“為什麼”和“如何”的問題,因為回答“探索”問題在結構上與“報告”問題不同。

正如任何資料從業者可以證明的那樣,探索問題是一個創造性的過程,它會發現資料中的模式,形成解釋觀察的假設,找到支援或證偽這些假設的證據,最後構建令人信服的敘述。

我的資料庫中有超過一萬億個事件,我可以計算一個按鈕的點選次數,但為什麼人們會點選呢?他們為什麼停下來不點選呢?

為什麼 DAU 上升?為什麼人們會退出漏斗?為什麼這個 A/B 測試的收入下降了?這些是重要的問題。

漏斗、群組、A/B 測試、歸因。這些都是序列分析的風格——將事件拼接在一起來講述“為什麼” WHY 的故事。

但是單獨使用 SQL 來做這件事很糟糕。

 

要釋放探索“為什麼”的全部力量,我們需要訪問底層資料——原始事件流(日誌)。

處理事件通常是在同一使用者的時間相鄰事件的上下文中完成的(考慮每個使用者會話的操作、保留、歸因)。

這就是為什麼我們認為基於序列的分析是解鎖深度資料探索的下一代方法。

 

讓我們看看所有增長團隊都面臨的一個典型問題:

我們如何才能提高使用者轉化率?

通過基於指標的分析來回答這個問題的常用方法是建立一個使用者漏斗。它可以粗略地指出最大的使用者流失發生在哪裡,但不能指出為什麼或如何改進。

相比之下,使用基於序列的分析,我們可以比較轉換使用者與未轉換使用者的常見網站/應用會話路徑。

這為我們提供了使用者離開的確切頁面和使用者狀態,並有助於瞭解非轉換使用者的行為。更容易思考使用者行為差異的可能原因以及提高轉化率的方法!

 

探索事件序列比檢視指標具有更高的固有複雜性,並且分析工具尚未發現是什麼構成了序列分析的出色介面。常用的方法是桑基圖,但您真正發現它們有用的頻率是多少?我們可以做得更好。

資料探索本質上是視覺化和互動式的,具有人類的好奇心、模式匹配、直覺和反覆試驗。它幾乎是觸覺的,就像在你手中玩弄魔方一樣。

更好的資料探索工具是什麼樣的?

可以從其他創意領域的專家從視覺工具中汲取靈感:

  • 介面設計師有 Photoshop 和 Figma,
  • 遊戲開發者有 Unity,
  • 建築師有 AutoCAD,SketchUp工作流程。

 

相關文章