企業級大資料中臺架構實戰【3】
資料架構目標
大家有沒有遇到下面這種情形
情形1:
每個月總有那麼幾次別人反饋資料不準的問題,並且有些人反映我們的資料,髒,亂,差,不準確,最終導致業務方不滿意,對資料團隊產生抱怨情緒。
情形2:
取數不斷,需求不斷,疲於奔命,四處救火,一會這裡有問題,一會那裡有問題,最終團隊內部成為人肉取數機,天天加班,成為了一名真正的SQL-BOY。到了年底考核,你們團隊加班最多,但是產出價值最低,考慮到你們還是有苦勞的,給你箇中等把,一臉懵逼,還不知道所以然。
聊到這裡,上面情形面對的問題是不是我們在設計架構時候,就需要考慮解決的問題。為什麼資料不準確,為什麼產資料的資料沒有價值,得不到業務認可,得不到老闆的認可,那麼這幾個為什麼引出的我們的架構目標。
一個資料團隊假設有5個人,平均薪水2w,那麼對企業來說,一個月的成本10w,一年的人工成本120w,再加上IT成本,至少200w+。企業不會養閒人的。成本在這裡,那麼我們架構的目標其實也在這裡,就是如何減少企業成本,提高效率。資料價值該如何體現,是我們架構的主要目標。
高管會關心目前公司產品運轉現狀,資料是否錄得好的增長,營收情況如何,企業效率是否有所提高。從宏觀層面,大資料能夠很好概括、監控公司的產品大盤,整體性反饋使用者行為。
產品運營會關心,當前使用者滿意度如何,AB測試下的新功能是否顯著有效,產品現有功能是否穩定,使用者行為是怎樣的,運營活動效果表現如何?從微觀層面,大資料能夠刻畫每類乃至每個使用者的行為模式和反饋,並且透過洞察這些行為打造相關的效率工具。
研發、測試和運維會關心,我們所打造所維護的軟體服務、系統、客戶端是否足夠健壯,可用性是否得到保障,各個模組是否反應足夠敏捷快速。大資料透過合理的資料埋點,能夠輕易勾勒出全鏈路的產品服務質量,打造企業獨有的APM工具系統。
大資料中臺架構
為了面向業務服務服務建模,為了整合資源,為了讓資料複用,為了讓資料的價值得到更好的分析挖掘,為了.....,我們設計了下面大資料中臺分層架構。
大資料中臺總體分層架構耦合性比較低,分為PAAS(platform as a service)層、 DAAS (data as a service)層、DA(data application)層共三層架構。
資料倉儲層可以分為四層,分別是ODS層、 DW層、 DM層、 DA層等。
為什麼這樣設計?清晰的資料結構,每一個資料分層它的作用域,在使用表的時候能更方便的定位和理解;遮蔽業務的影響,不需要每次業務的變動,就需要重新接入資料,進行計算;遮蔽原始資料的異常,經過前面幾層的資料清洗,後續資料分析得到的資料都是非常乾淨的資料;減少重複開發工作,嚴格規範資料分層的作用,開發出來一些公共的資料,可以極大的減少資料的重複計算;將複雜的資料統計邏輯簡單化,將複雜的任務按照分層,分層一個個任務,每一層只是處理其中的一步,後續資料自測的時候,進行資料準確性校驗,同時後續萬一資料有問題了,修復問題後重新跑資料,我們沒必要把資料資料都跑一遍,只要跑有問題的那一張表後面的任務流程就可以了。
其實最重要的是,我們可以做資料地圖,當我們業務部門特別多的時候,我們給他們開發寬表資料,對應的寬表,如果有一張表有問題,我們可以透過資料地圖快速的定位找到這張寬表從哪裡來的,涉及到哪些資料來源,做了哪些清洗等。
各層作用
PAAS層
我們需要考慮,從資料採集,資料處理,資料儲存,資料分析挖掘,資料視覺化等一些列的元件技術,還包括任務排程,資料建模,資料治理等一些列工具等。
DAAS層
構建離線資料倉儲架構和實時資料倉儲架構,平臺級別。涉及到規範層面,資料庫及表的命名規範;業務匯流排矩陣,明確各個業務所屬的分析主題模組,業務過程所屬的資料域,一致性維度和事實,資料口徑全平臺統一;還有維度與業務過程之間關係矩陣等等。
維度建模流程:
首先,需求調研,需求分析,確定分析的業務模組,確定所屬的資料域
然後,構建維度事實匯流排矩陣,明確業務過程;明確業務過程維度之間的關係,同時明確統計指標(原生指標,派生指標)
其次,維度事實模型設計,指標結果表的設計,一般在mysql,hbase,ck等
最後,進行資料準確性校驗,上線
DA層
這層主要是資料應用,資料業務化的過程,也是資料價值的輸出,同時也是和業務形成完整閉環的過程。一般透過Bi報表將業務的客觀資料呈現出來,反映業務的一個現狀,提供給業務方做決策支撐。
同時我們還可以做使用者畫像,運營改善,精細化運營,廣告投放,預警,告警,使用者價值挖掘等等。
資料來自業務,資料最終也要賦能業務,實現業務資料化,資料資產化,資產服務化,服務業務化,讓企業真真切切的達到降本增效。
來自 “ 豬豬聊資料 ”, 原文作者:豬豬;原文連結:https://mp.weixin.qq.com/s/ByxFqgyvg8ifuVSztRg92g,如有侵權,請聯絡管理員刪除。
相關文章
- 企業級大資料中臺架構實戰大資料架構
- 企業級大資料中臺架構實戰【1】大資料架構
- 企業級大資料架構設計【2】大資料架構
- 資料中臺(架構篇)架構
- 資料治理與資料中臺架構架構
- 10張架構圖詳解資料中臺,附全套資料中臺PPT架構
- 資料中臺:資料服務的架構設計實踐架構
- 資料中臺元年,企業數字化轉型面臨的三大挑戰
- 一張圖剖析企業大資料平臺的核心架構大資料架構
- HBase+Elasticsearch,百億級資料中心架構設計實踐Elasticsearch架構
- 【資料中臺商業化】資料中臺微前端實踐前端
- 阿里雲產品之資料中臺架構阿里架構
- DTCC 2020:淺談企業資料中臺建設實踐
- 阿里大資料產品Dataphin上線公共雲,將助力更多企業構建資料中臺阿里大資料
- 摩杜雲:構建資料中臺安全,保障企業核心資料安全
- 工業級數倉分層及高併發鬆耦合大資料平臺架構深入剖析-DW商業環境實戰大資料架構
- 企業資料中臺實施過程中失敗的因素
- 談PaaS平臺建設:如何應對企業架構多元異構資源的挑戰架構
- 美圖大資料平臺架構實踐大資料架構
- 雲端儲存架構中企業級資料流轉平臺技術方案架構
- 阿里雲資料中臺升級Quick Audience實現企業與消費者雙向互動阿里UI
- 奇點雲資料中臺技術匯(一) | DataSimba——企業級一站式大資料智慧服務平臺大資料
- 《離線和實時大資料開發實戰》(二)大資料平臺架構 & 技術概覽大資料架構
- 資料中臺不是企業的萬能妙藥
- Spark+ClickHouse企業級資料倉儲實戰Spark
- Sentry 監控 - Snuba 資料中臺架構(Data Model 簡介)架構
- Sentry 監控 - Snuba 資料中臺架構(Query Processing 簡介)架構
- 企業實施分散式架構的挑戰以及應對建議 | 上海 ATEC 大會實錄分散式架構
- 企業實施分散式架構的挑戰以及應對建議|上海ATEC大會實錄分散式架構
- 大資料---(3)金融資料架構大資料架構
- 打造企業級微服務平臺架構,分散式應用場景管理微服務架構分散式
- 架構實戰架構
- 企業在資料中臺上該怎麼選擇
- 資料中臺即服務——資料中臺的四大支柱
- Sentry 監控 - Snuba 資料中臺架構簡介(Kafka+Clickhouse)架構Kafka
- 數智洞見 | 資料中臺架構解析及未來展望架構
- 飛書 + Lua 實現企業級組織架構登入認證架構
- 以企業級實時資料平臺為例,瞭解何為敏捷大資料敏捷大資料