基石視覺化資料分析平臺設計實踐
1 概述
在當下數字化轉型的大環境中,資料成為企業發展重要基石,如何利用好資料進行分析也成為更多企業面臨的首要問題。隨著資訊科技發展,資料分析平臺作為一種新型的企業管理工具,可以幫助企業實現資料收集、處理、分析和應用的全過程,為企業提供全面、準確、及時的資料和決策支援。
部門內部自研的資料視覺化分析平臺-基石,基於傳統BI多型別資料來源管理,在自助式生成資料展示頁面的基礎上,加強了資料增強分析能力。其中異動分析、轉化分析、漏斗分析等大大提高了資料分析的效率,使分析師和運營人員專注於分析業務、市場行為,瞭解客戶的核心需求、預測市場趨勢,為企業提高業績,獲取競爭優勢。
2 背景
58同城作為中國領先的生活服務平臺,業務覆蓋招聘、房產、汽車、本地生活服務等領域。每日產出億級別資料,資料分析師對海量資料多維度展示和資料分析需求強烈。部門內部的視覺化基石BI基於使用者需求,提供資料自定義看板展示和增強分析能力,支援拖拽式操作和豐富的展示效果,幫助使用者靈活搭建資料看板,從不同的角度對資料進行解讀和挖掘,對資料進行全面的監控和分析,及時發現異常情況和風險點,提供預警和決策支援。
3 基石BI平臺介紹
不同於傳統BI工具,基石BI提供了完整的資料閉環,對資料進行抽取、整理、分析、報表輸出等,透過資料對企業決策提供支援和幫助。
3.1 基石BI核心流程
資料連線:使用者將要查詢的資料表接入到BI中。
資料準備:將資料表進行查詢整理,形成資料集,進行資料標註。
資料看板:設定看板對應資料集,拖拽外掛進行佈局,固化為資料看板。
資料應用:配置應用資訊,對外輸出資料看板。
增強分析:透過演算法模型進行有效的資料分析,查詢異動、轉化分析資料。
3.2 層級結構示意圖
3.3 基石BI設計標準
工具化:轉化思想,從以往已報表為核心在不同系統開發展示,或是採購其他廠商應用,轉化為自研資料工具思維,使功能工具化標準化,提高效率,保證資料一致性和安全性。
平臺化:研發BI分析平臺,簡單快捷的進行視覺化看板搭建,對外輸出平臺化產品,進而實現一處設定,多處使用。
智慧化:實現業務智慧化,基於演算法模型持續產出異動分析、轉化分析等智慧分析元件,提升平臺競爭力,有效為企業決策提供資料支援。
4 基石BI平臺實踐
為了滿足業務需要多端視覺化資料查詢展示、資料推送、資料分析能力,設計架構如下圖所示:
平臺架構是基於BI系統通用流程建立,服務主要包含閘道器接入服務、Oauth授權服務、資料預覽展現服務、資料查詢解析、結果聚合服務、資料查詢引擎服務、增強分析服務。從業務角度看,平臺按照業務需求,統一資料處理邏輯,強化展示分析,提高資料使用率,設計為4層模組:
資料接入層:統一資料來源,多型別資料來源接入BI體系,支援定時同步,資料加工管理,讓資料更好的展現。
資料服務層:研發資料查詢引擎,提供查詢解析和結果聚合服務,能夠處理資料複雜查詢,提升效率。
資料展現層:基於資料查詢解析、資料預覽服務,搭建使用者需求分析看板,設定許可權管理,使資料靈活展現。
增強分析層:結合演算法模型,更深層挖掘資料潛力,智慧診斷,支援維度下鑽、指標探查等,為企業運營提供多維度資料支援。
以下分別介紹4層模組的詳細設計:
4.1 資料接入層
統一資料生態,讓資料更便捷準確接入BI平臺資料體系,使資料充分得到挖掘利用
統一資料來源,透過許可權設定,將資料有效管理。
支援資料來源實時校驗,資料連線。
4.2 資料服務層
資料服務面臨的困難:指標計算、衍生計算複雜,且底層資料來源引擎能力和查詢sql都不一樣(Mysql,ClickhouseSQL,Doris),導致開發成本很高,新增一種資料來源型別就要開發對應資料查詢能力。
解決方案:研發資料查詢引擎和資料解析聚合服務,提供語句分析,透過語法解析聚合,進行查詢構建,對不同資料型別進行查詢。
4.3 資料展現層
4.3.1 看板搭建:透過拖拽內建元件,自定義頁面佈局,選擇元件對應資料展示源,設定維度、指標等查詢配置,基於資料解析、資料查詢引擎服務,實時展示資料,自助式生成視覺化需求看板。在滿足功能基礎上,做了三方面最佳化:
頁面元件最佳化:最佳化元件拖拽顯示體驗,做到低延遲高流暢;對元件進行二次開發,提升資料展示效果。
互動效果最佳化:平臺前後端呼叫互動最佳化,合理構建元件資料查詢引數,提高平臺解析資料效率;平臺操作頁面互動最佳化,讓使用者使用更便捷,提高操作易用性。
欄位條件最佳化:動態設定欄位過濾器,新增多種格式設定,支援日期、數值、字典欄位等自定義配置,更加靈活進行資料過濾。
4.3.2 應用管理:新增看板所需展示的應用資訊,實現一處配置,多處展示需求。
應用資訊:對應用進行管理,配置每個應用唯一的授權Key,設定授權模式、授權域、令牌時效資訊,安全穩定的與第三方業務應用進行對接。
看板嵌入:將平臺看板和應用進行繫結,實現一處配置,多處展示。提供對接服務,高效快捷的使看板嵌入其他業務應用。
資料許可權:透過設定 應用-看板-使用者 資料許可權關係,精確設定到每個元件不同人員檢視的行許可權,做到千人千面,靈活展示。
4.3.3 資料展現:多形式,多維度資料展示,及時有效瞭解資料詳情。
郵件推送:平臺提供截圖服務,對定時傳送的資料包告提供郵件推送能力。
多端展現:在PC端配置完成後,能在移動端和H5端自動適配,動態適應看板展示場景。
分析展現:提供下鑽維度、智慧分析等多種展現功能,提高資料使用率,充分挖掘資料深度。
4.4 增強分析層
除了傳統資料來源,看板等BI模組,在後端服務上新增加強分析,結合演算法模型,對趨勢資料監控異常點,智慧診斷(Adtributor演算法),進行維度下鑽分析等。具體如下:
4.4.1異動智慧分析
1) 指標監控方法與實施
a.理論基礎:
統計方法:基準值指定為均值。均值的計算設定為,以近期(7天、30天)資料進行滾動均值計算。誤差的範圍選取,以 標準差或者3σ 為建議範圍。
閾值方法:基準值指定為環同比的上週期資料,允許分析師自定義波動閾值。根據自定義的閾值,進行資料波動範圍視覺化展示。
建模方法:基準值透過ARMA時間序列預測&fb-prophet時序預測獲取。異常判斷將更智慧,相容性更好。
b.實現邏輯:
c.效果展示:
2)異常歸因方法與實施
a.理論基礎:
基於Adtributor演算法對異動點分析,演算法的核心主要是:驚喜度SURPRISE,解釋力EP。Adtributor對異常指標的所有維度和元素,根據當前的數值和參考的數值,計算EP值和S值
S值 :
根據驚喜度計算出,針對關鍵的指標,計算所有維度下的所有元素和參考值的差異,即計算每個元素的Sij(m),然後進行求和得到S值,然後找出哪些維度可能存在異常,根據S值進行降序排序,找出最意外的維度。
EP值:計算每個維度下每個元素在該分析的指標上的變化總數的佔比,EP值是針對單個維度進行衡量每個元素的重要程度。
簡單來說,就是針對單個維度進行歸因分析,根據S值找出最大的異常維度,根據EP值給出解釋說明。
b.實現邏輯:
4.4.2 漏斗加強分析
1)漏斗分析是衡量轉化效果、進行轉化分析的重要工具,是一種常見的流程式的資料分析方法。它能夠幫助你清晰地瞭解轉化情況,從多角度剖析對比,定位流失原因,提升轉化表現。
2)
a.漏斗分類
無序漏斗:在漏斗的週期內,不限定漏斗多個步驟之間事件發生的順序。
【計算規則】:假設一個漏斗中包含了 A、B、C 3個步驟,A步驟發生的時間可以在B步驟之前,也可以在B的後面。使用者的行為順序為A、B、C的組合都算成功的漏斗轉化。即使漏斗步驟之間穿插一些其他事件步驟,依然視作該使用者完成一次成功的漏斗轉化。
有序漏斗:在漏斗的週期內,嚴格限定漏斗每個步驟之間的發生順序。
【計算規則】:假設一個漏斗中包含了 A、B、C 3個步驟,A步驟發生的時間必須在B步驟之前,使用者的行為順序必須為A->B->C 。和無序漏斗一樣,漏斗步驟之間穿插一些其他事件步驟,依然視作該使用者完成一次成功的漏斗轉化。
b.漏斗建立
選取漏斗型別 :有序漏斗和無序漏斗,平臺預設選擇有序。
新增漏斗步驟 :漏斗步驟就是漏斗分析的核心部分,步驟間統計資料的對比,就是我們分析步驟間資料的轉化和流失的關鍵指標。
確定漏斗的時間區間和週期 :一般來說,此類資料的數倉表是按照時間分割槽的。所以選擇時間區間,本質就是選擇要計算的資料範圍。週期是指一個漏斗從第一步流轉到最後一步的時間限制,即是用來界定怎樣是一個完整的漏斗。
3) 平臺漏斗實現
基於 ClickHouse 的 windowFunnel 函式做有序漏斗分析,在所定義的滑動視窗內,依次檢索事件鏈條。函式在這個事件連上觸及的事件的最大數量。
a.實現邏輯:
b.效果展示:
5 總結
基石BI在滿足傳統BI工具資料對接、資料查詢的功能基礎上,加強了看板展示和基於演算法模型的資料分析能力,目前已經應用到集團投放月報分析推送、運營分析渠道效果展示等日常分析工作,很好的滿足資料分析人員對資料探勘和資料利用的需求。不但提高工作效率 ,也更深層挖掘資料變化原因,提升資料使用價值,對資料進行全面的監控和分析,及時發現異常點和風險點,為制定決策和快速發展提供準確及時的資料保障。未來平臺會在實時資料效果分析、智慧報告、智慧預警監測方面不斷最佳化更新,讓資料更深層的服務於業務,創造更大價值。
來自 “ 58技術 ”, 原文作者:劉乃翔;原文連結:https://server.it168.com/a2023/1222/6834/000006834414.shtml,如有侵權,請聯絡管理員刪除。
相關文章
- 資料視覺化實踐視覺化
- BI 資料視覺化平臺建設(2)—篩選器元件升級實踐視覺化元件
- 基於 Echarts 的資料視覺化在異構資料平臺的實踐Echarts視覺化
- 資料視覺化平臺搭建,警務實戰平臺大資料應用視覺化大資料
- 資料海洋視覺化,Splunk平臺價值實現視覺化
- 資料視覺化之下發圖實踐視覺化
- 大資料視覺化平臺優點在哪大資料視覺化
- 資料視覺化平臺有什麼作用視覺化
- ETL資料整合平臺,RestCloud視覺化ETLRESTCloud視覺化
- BI 資料視覺化平臺建設(1)—交叉表元件演變實戰視覺化元件
- 智慧警務大資料平臺開發,資料視覺化分析平臺搭建大資料視覺化
- 貨拉拉自助資料分析平臺實踐
- 智慧公安視覺化資訊研判大資料平臺視覺化大資料
- 如何利用資料視覺化大屏把握消防大資料平臺實況視覺化大資料
- Vue全家桶+Echarts資料視覺化實踐VueEcharts視覺化
- 資料視覺化平臺由哪些要素組成視覺化
- 大資料視覺化平臺有哪些優勢大資料視覺化
- 用低程式碼平臺視覺化設計表單視覺化
- OPPO大資料診斷平臺設計與實踐大資料
- 公安情指勤一體化實戰平臺建設,大資料視覺化分析系統開發大資料視覺化
- 頭歌實踐教學平臺-泰坦尼克生還預測——視覺化與探索性資料分析-答案視覺化
- 資料視覺化分析平臺開源方案集錦視覺化
- 騰訊資料平臺 SaaS 化實踐
- 大資料視覺化平臺有什麼特點大資料視覺化
- elasticsearch7.6.2實戰(2)-es視覺化及分析平臺-kibanaElasticsearch視覺化
- 資料視覺化能否代替資料分析視覺化
- 愛奇藝大資料實時分析平臺的建設與實踐大資料
- 用Vue構建一個github“視覺化大資料平臺”-GitDataV,設計開發分享VueGithub視覺化大資料
- 視覺化資料分析軟體視覺化
- 開源的資料視覺化平臺 Kibana 日誌視覺化 mac 安裝筆記視覺化Mac筆記
- 三維視覺化設計軟體,可以實現資料視覺化的軟體有哪些視覺化
- 用umi+dva+antd打造的資料視覺化平臺視覺化
- DKHadoop大資料視覺化平臺監控功能深度解析Hadoop大資料視覺化
- 資料視覺化編輯平臺上線,小程式也能擁有視覺化圖層視覺化
- .NET Core + ELK搭建視覺化日誌分析平臺(上)視覺化
- 資料視覺化效果怎麼做,資訊視覺化設計用什麼軟體視覺化
- 公安情報分析平臺建設解決方案,視覺化大資料情報研判系統開發視覺化大資料
- vivo 商品中臺的視覺化微前端實踐視覺化前端