資料治理 - [03] 專業術語及其說明

HOUHUILIN發表於2024-10-12

題記部分

一、資料管理

  資料管理是指組織對其整個資料生命週期進行的規劃、執行和控制,以期最大化資料的價值。它涵蓋了從資料採集、儲存、處理到最終使用等全部過程。

  良好的資料管理需要進行全面的戰略規劃,包括確定組織的資料需求、資料架構的設計、明確資料收集方式、建立資料安全與監控措施等。同時還需要具體的執行方案,如資料採集系統的搭建、儲存介質的選擇、資料處理流程的設定、以及資料分析和應用平臺的開發。

  在資料管理過程中,必須重點關注資料質量的管理。需要監測和提高資料的完整性、一致性、準確性、及時性等指標,保證資料質量滿足業務需求。此外,還需要進行資料服務、資料安全、資料生命週期、後設資料等方面的管理,建立強大的技術支撐。

  成功的資料管理還需要管理組織的配合,如成立資料管理部門,或在IT、業務部門中設立資料管理崗位,明確資料管理的職責分工。要形成一個高效的資料治理架構,進行持續的資料治理工作。

  資料管理需要與公司業務目標緊密結合,服務於業務發展。它需要在減少組織資料管理成本的同時,最大限度地發掘資料的價值,為企業的運營和決策提供堅實的基礎。一個成熟的組織必須建立科學、系統、持續的資料管理體系,以提高其核心競爭力。

  也就是說,資料管理是一項系統工程,需要在戰略、組織、流程、技術等方面進行規劃和建設,做到對資料全生命週期的管控。只有這樣,才能真正發揮資料對企業的支撐作用,創造更大的商業價值。

  用大白話說,資料管理就是實實在在的資料管理相關的工作,具體的事。

二、資料治理

  資料治理是組織進行資料管理的重要組成部分,它提供了資料管理所需的決策、監督與控制能力。資料治理的目標是制定資料使用規範,最佳化資料系統,確保資料的可用性、一致性、質量和安全性。

  建立資料治理的第一步是組建資料治理組織架構。這通常包括設立資料治理委員會,由高管及業務、IT等部門負責人組成,負責制定資料策略和標準。同時還需要設立資料所有者、資料管理員等資料治理角色,分工明確。

  資料治理的主要工作包括制定資料治理策略和框架,進行資料資產登記,建立資料目錄、資料地圖,以全面瞭解企業資料資產。還需要持續對資料進行監控與考核,衡量資料質量,並進行風險評估與處理。制定清晰的資料使用規範和職責是資料治理的重點。

  此外,資料治理還需要建立支援性的技術體系,如後設資料管理系統、資料質量管理平臺等。要加強對商業智慧和大資料平臺的治理,確保分析應用的資料可靠性。還需要關注資料的安全控制和審計。

  資料治理需要管理層的重視和業務部門的積極參與。要從企業文化層面營造關注資料管理、堅持資料標準的氛圍。同時不斷最佳化和迭代資料治理流程,使之與業務需求保持一致。只有這樣持續推動,才能使資料真正成為企業重要戰略資產。

  資料治理是對組織資料進行管控和治理的系統舉措,需要在組織、流程、技術等方面建立全面的機制,以實施有效的資料管理,釋放資料價值。

  資料治理是一種機制,有一個說法很貼切,資料管理是CEO做具體執行,而資料治理是董事會,要做監管。

  資料治理是要確保資料是被管理的。

  當然由於資料治理的重要性,這個詞現在被放大了,廣義的資料治理,包含了資料治理、資料管理的一切。

三、資料中心

  資料中心是企業用於儲存、管理資料的物理基礎設施,它包含了伺服器、儲存裝置、網路裝置等IT基礎架構,為資料管理提供了硬體支撐。資料中心的核心功能是對企業資料進行中心化儲存、統一管理。

  建立一個資料中心需要準備機房空間,機房對溫度、溼度、防靜電、防火等都有嚴格要求。同時要投入建立電力、冷卻等基礎運維設施。在伺服器方面,需要大量的雲伺服器、虛擬化技術等,以靈活調配計算資源。儲存系統要足夠大容量,並考慮冗餘備份。網路系統需要提供高速內部交換連線和對外鏈路頻寬。

  資料中心還需要監控系統對基礎設施進行實時監測,並建立完善的安全防護體系,如訪問控制、防火牆、入侵檢測等。要制定詳細的災備方案和演練機制。此外,要配置專業的運維團隊進行日常管理。

  建成後的資料中心要承載交易系統、ERP系統、CRM系統、資料倉儲等企業關鍵資訊系統,進行集中資料儲存。同時還要對來自網站、App、IoT等渠道的海量資料進行匯聚。透過虛擬化、雲端儲存等技術進行資源最佳化,實現資料的集中管理。

  高質量的資料中心還要提供備份服務、災備服務。面向企業內部客戶提供儲存空間和計算服務等IT資源。透過自動化運維提升管理效率。

  資料中心是企業資料管理的重要基石,需要在基礎架構、安全體系、運維流程等方面進行全面規劃和建設,以提供穩定、安全、高效的資料儲存與管理服務,贏得客戶的信任。

四、資料中臺

  資料中臺是在資料中心之上,構建的一整套包含資料管理、分析和服務於一體的平臺。資料中臺以資料為核心,致力於構建統一、標準化的資料能力,為企業提供更高價值的資料應用。

  建設資料中臺的第一步是規劃統一的企業資料架構,將企業內各類離散資料進行統一規劃,確定中心資料倉儲和資料集市場。然後針對不同業務場景,構建標準化的資料整合模型、資料服務模型。使不同系統的資料能夠互聯互通。

  在資料治理方面,資料中臺將不同系統的資料整合入統一的平臺,建立資料標準、資料評估體系、資料安全體系,對內部資料進行集中治理。確保資料質量可控、資料應用可信。

  資料中臺還具備企業級的資料應用和分析能力。可以對內外部資料進行採集、清洗、轉換,構建高質量分析資料集,並透過報表、分析模型、資料視覺化等方式,幫助企業進行業務決策和最佳化。利用AI等先進技術進行智慧分析。

  此外,資料中臺還向不同部門和外部系統開放服務介面,實現資料服務化。可對內提供精準客戶畫像等資料服務,對外開放資料產品。構建以資料為核心的生態圈。

  建設資料中臺,需要企業進行技術架構升級,採用大資料、雲端計算等新興技術。還需要規劃資料中臺組織機構,配置專門的資料建模、分析等人才,並制定資料開放利用的政策。

  資料中臺構建了企業資料管理和應用的樞紐平臺,有助於釋放資料價值,推動業務創新。它是進行數字化轉型的重要基礎,也是提升企業核心競爭力的關鍵所在。

五、資料湖

  資料湖是指企業將各類原始資料直接存放在一個湖形資料池中的架構理念。它可以儲存和管理大量不同格式的結構化、半結構化與非結構化資料。

  資料湖強調直接儲存資料樣本或原始資料,而非轉化或劃分資料,它採用扁平化的共享資料目錄供每個使用者查詢各自所需資料。使用者可以對資料進行互動分析和探索,以發現不同資料來源之間的關聯性。

  構建資料湖的第一步是建立集中式的基礎資料儲存,如Hadoop系統。然後將企業各類資料來源,包括資料庫、感測器、日誌、文件等資料直接載入到這個開放儲存中,不進行前期的資料清洗和轉換。接下來構建資料目錄,標記不同資料的特徵後設資料。最後提供分析工具,方便使用者自助分析和查詢資料。

  與只儲存精煉資料的傳統資料倉儲不同,資料湖可直接儲存原始細節資料。它對資料輸入沒有嚴格限制,可以靈活擴充套件,透過包含更多資料來支援更豐富的分析應用。但資料湖中的資料準確性和精煉程度不如資料倉儲,需要使用者自行轉換,它更適合資料科研人員進行探索分析。

  構建資料湖時,主要挑戰在於如何管理各類雜亂無章的資料,需要管理資料的來源、格式、屬性等後設資料,並建立安全控制。還需要不斷補充分析和視覺化工具,才能更易於使用。

  資料湖為企業提供了一個直接儲存和分析所有資料的環境,能夠更全面地發掘資料價值。它降低了資料整合的門檻,但也需要積極應對資料治理的挑戰。資料湖代表了企業資料管理走向開放、去中心化的發展趨勢。

— 業精於勤荒於嬉,行成於思毀於隨 —

相關文章