車企資料治理實踐案例,實現資料生產、消費的閉環鏈路 | 數字化標杆

數棧DTinsight發表於2023-12-05

隨著業務飛速發展,某汽車製造企業業務系統數量、複雜度和資料量都在呈幾何級數的上漲,這就對於企業IT能力和IT架構模式的要求越來越高。加之企業大力發展 、新能源車等業務,希望透過持續最佳化客戶體驗,創造可持續發展的數字化轉型之路。

為更好應對數字化變革所帶來的挑戰,現有的豎井架構的資料體系難以滿足越來越多、越來越快的系統和資料互動、敏捷創新應用、資料共享、新業務擴充的需求。以資料驅動的數字化,將幫助車企全面瞭解使用者的需求變化,也能為企業在營銷、生產、服務等各個環節提供支撐,進一步提升企業的經營效率。

在開展某車企資料化轉型時,需要解決三個核心問題:如何收集彙總和運營自己的資料?如何建立資料治理運營團隊?如何在短期內快速展現成果,在企業內部建立信心?

本次某車企資料中心二期的建設重點是 。資料治理平臺的核心理念在於“資料取之於業務,用之於業務”,即完整構建某車企從資料生產到消費,消費後產生的資料再回流到生產流程的閉環過程。

01 資料“生產-消費-生產”閉環的資料治理方案

1、諮詢服務

在某車企組織架構、制度體系和資料資產盤點的基礎上,結合國際、國內和行業標準,圍繞資料資產全生命週期管理,制定相關的 。透過資料治理諮詢建設所涉專案的 ,包括標準、組織、規範、流程、制度等,實現營銷業務線、製造業務線、研發業務線資料分級分類標準制定,形成包含主資料、資料標準、 、後設資料、資料質量、資料安全、資料生命週期、資料架構等標準、流程與管理制度,並具備推廣至全公司業務線的能力。

一是資料治理體系規劃。資料治理整體規劃方面包括資料管理願景、組織模式、管理邊界和推動策略,資料管理體系設計方面包括資料治理基礎、資料管理核心領域、資料應用,任務及規劃方面包括 、實施原則分析、實施計劃制定。

二是資料治理組織規劃。根據資料管理工作的實際需要,在業務部門、技術管理部門和業務應用部門間要確定各個工作人員的職責。例如不同的業務部門應該明確各自業務開展對資料的具體要求和相關規則,而技術部門則會根據業務部門的需求負責具體的實施工作,包括將業務部門提出的要求轉化成技術語言,用於事前的控制(如欄位的約束)、事中的邏輯控制(例如控制不能為空)、事後的核查,以及具體的技術操作和編制定期的報告等。

2、平臺搭建

提供 與 ,滿足資料離線開發、實時開發、資料建模、資料標準、資料質量、資料血緣、資料安全、後設資料管理、資料資產、資料標籤等能力,整合 、開放平臺、排程平臺與視覺化平臺,管理資料資產、提升資料質量,打造資料資產中心、支撐業務創新的資料服務中心和應用中心。

file

3、專案實施

梳理營銷業務線、製造業務線、研發業務線資料資產,劃分 ,構建資料應用,實現資料生命週期全流程打通。具體實施內容包括資料資產地圖、資料模型、資料標準、後設資料管理、資料血緣、 、資料質量規則及報告等。

一是資料資產門戶

全域性統計企業資料資產情況,讓企業管理者對資料的分佈、增長、使用、質量情況有直觀的瞭解。包括不限於:

1) 的統計:資料來源數量、表數量、儲存量、使用量、質量評分。 2)資料趨勢的統計:資料分佈情況、資料增長趨勢、資料使用熱度。 3)資料使用排行:資料儲存排行;後設資料質量:規範趨勢、規範排行。

file

二是資料地圖

的定位是視覺化的資料資產中心,使用者可以在資料地圖模組中檢視平臺內的所有資料表情況,同時可以進行全方位管理資料資產。

1)資料查詢:匯聚平臺內的所有資料表資訊,方便開發人員快速定位所需資料表,支援使用者根據類目、表名、所在專案、授權狀態進行過濾,或直接根據表名搜尋。

2)資料表後設資料展現:使用者指定某張表後,可以檢視此表的基本資訊,包括表名、物理儲存量、生命週期、是否分割槽表、欄位名稱、欄位型別、分割槽資訊等,同時可以進行預覽,直觀地檢視錶內資料情況。

3) :當平臺內的資料表越來越多時,資料類目的重要性就會日益突出。提供3層類目的管理,使用者可自定義層級、名稱,並將資料表指定至某個節點上,資料開發者在尋找資料時可根據資料類目快速定位。

4)資料審批授權:提供 的管理,當使用者需要跨專案訪問表時(讀/寫)需先經專案管理員審批授權,審批透過後才可以對錶進行跨專案訪問。同時,授權審批具備有效期的概念,超出有效期後自動取消授權,提升資料訪問的安全程度。

4)生命週期管理:提供表的生命週期管理,使用者可在建表時指定生命週期,系統定時檢測每張表/分割槽的資料更新時間,超出時間後自動刪除資料,降低臨時資料造成的儲存壓力。

5)資料血緣解析:提供自動解析同步任務和SQL程式碼,自動建立各個資料表的表級、欄位級血緣關係,使用者可直接在頁面上看到每個指標的“前世今生”,便於快速排查指標問題,檢查指標統計邏輯,依賴鏈路是否正常等。

三是資料質量

作為資料治理的內容, 的保障與提升是大資料平臺的必備功能。資料質量的管理工作大致可以按照事前、事中、事後的流程化體系來進行,即事前的監控規則定義、事中的資料生成監控、事後的資料質量分析。

file

1)事前管理:接入需要管理的資料來源,並結合對業務需求和資料的理解,對需要監控的資料配置監控規則。

2)事中管理:透過對定義好的監控規則配置排程週期,系統自動執行,校驗資料質量。

3)事後管理:對校驗不滿足規則的資料,及時發出錯誤提醒。同時系統自動生成監控報告,幫助使用者覆盤總結資料問題。

四是資料安全

1)資料許可權控制:支援表級資料許可權的管理,當使用者需要跨專案訪問表時(讀/寫)需先經專案管理員審批授權,審批透過後才可以對錶進行跨專案訪問。同時, 具備有效期的概念,超出有效期後自動取消授權,提升資料訪問的安全程度。支援資料資源服務的許可權申請、審批,保障資料服務的安全性。

2)生命週期管理:支援 ,使用者可在建表時指定生命週期,系統定時檢測每張表/分割槽的資料更新時間,超出時間後自動刪除資料,降低臨時資料造成的儲存壓力。

3)資料影響解析:當使用者配置了 ,並透過SQL任務進行多個步驟的清洗、轉化處理之後最終會將結果資料輸出,在整個處理鏈路中,資料的血緣關係就隱含在同步任務和SQL程式碼中,資料影響表示每個統計指標是如何從原始資料得到的過程。

4)資料脫敏:支援 ,可應用於不同的敏感資料防止資料預覽時造成資料洩露。包括支援根據國標自定義安全等級,對人、表進行分級分類定級;支援自定義指令碼函式、 ,按需關聯識別規則、識別函式及脫敏規則,自動動態識 別敏感資料;支援內建多種敏感資料識別定期模板,即身份證、銀行卡號、郵箱、手機號、IP、固定電話、 車牌號、姓名、公司、地址的識別,同時提供使用者自定義規則。

02 搭建資料治理平臺,資料質量大幅提升

某車企透過 ,完成了資料規範、標準、質量、服務體系、治理組織架構等內容建設,基本能滿足企業2—3年資料發展的使用訴求。結合資料中臺+資料治理方案,在該階段取得了階段性的成果:

一是構建強大 ,透過資料平臺的建設,為某車企實現資料基礎處理平臺、資料資產管理平臺、資料服務平臺。從而實現從標準化資料採集、資料質量管理、資料資產管理和資料應用的整套資料標準化處理流程,同時對接BI和報表工具,同時對後設資料進行標準化的API管理能力。

二是快速定位資料問題根本原因,有許多資料問題不一定是真正的資料問題,如果所有使用者一碰到難以理解的問題就找技術人員協助定位,技術人員則會花費過多時間在問題定位上的,最終導致資料問題會越堆積越多的。因此,本次專案為使用者提供自助排查的功能,協助使用者找到問題原因,實在解決不了的再找到技術人員協助解決。另外將資料流中間結果的資料視覺化呈現,便於在最終結果報表缺失或有誤的情況下,能夠快速定位出是資料出錯環節。

三是資料質量得到保障,資料價值高。資料質量可靠不僅提升了決策人員的決策效率以及成果,也可以降低發生風險的機率。當企業用可靠的資料時,可以更快、更一致地回答問題,做出決策。如果資料是高質量的,也能花更少的時間發現問題,而將更多的時間用於使用資料來獲得洞察力、做決策、服務使用者。

《資料治理行業實踐白皮書》下載地址:


《數棧V6.0產品白皮書》下載地址:


想了解更多有關大資料產品、行業解決方案、客戶案例的朋友,瀏覽袋鼠雲官網: https://www.dtstack.com/?src=szitpub


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69995740/viewspace-2998755/,如需轉載,請註明出處,否則將追究法律責任。

相關文章