資料編織 (Data Fabric) vs 資料網格 (Data Mesh)
近來,資料管理領域的熱詞也是不少,從國外來的資料編織 (Data Fabric) 和資料網格 (Data Mesh) 是兩個經常被提及的新話題。為了跟上新技術的步伐,我也對這倆概念做了一點功課,和大家一起探討。
Gartner給資料編織(Data Fabric) 的定義如下:
Data Fabric is a design concept that serves as an integrated layer of data and connecting processes.
資料編織是一個設計概念,表示資料和連線程式的整合層。
Forrester給出資料網格 (Data Mesh) 的定義如下:
Data Mesh is a decentralized sociotechnical approach to share, access and manage analytical data in complex and large-scale environments within or across organizations.
資料網格是一種分散的社會技術方法,用於在組織內部或跨組織的各種複雜和大規模環境中,共享、訪問和管理分析資料。
只看概念,是不是看不出啥端倪了,還是上圖吧!
資料編織 (Data Fabric) 把資料從生產到利用的過程分為3個層次:
最底層是記錄系統,也就是各個業務系統的資料庫。
中間層是透過 ETL 等手段轉移到按照資料庫型別分類的各個資料庫中。
最上層是一個整合層,面向使用者提供資料產品,注意實際的資料是儲存在中間層的。
那麼資料網格呢?還是上圖:
資料網格 (Data Mesh) 把資料從生產到利用的過程也是分為3個層次:
·最底層是記錄系統,也就是各個業務系統的資料庫。
·中間層是一個資料湖,資料在湖中做了物理集中。
·最上層是一個,額...,沒有最上層? 最上層其實是基於資料湖中資料形成的資料產品。
問題來了……資料編織 (Data Fabric) 和資料網格 (Data Mesh) 的區別在哪裡呢?
一個主要區別就是這個第二層,在資料編織中,資料是按資料庫型別經過轉換的規整資料,有點Bill Inmon理念資料倉儲的意思吧,資料是處理加工過的,方便給頂層呼叫。而資料網格的資料是全部在資料湖中,還都是原始格式儲存,有點Kimball理念資料倉儲的意思吧。
有什麼本質區別嗎?
有的人說有,有的說沒有,確實要先把“本質區別”是什麼定義清楚,才好說是否有本質區別。個人感覺,就是兩種不同的解決方案。中國人講的資料中臺概念,可以和他們放在一起並列,或者說各家的中臺解決方案,不是資料編織,就是資料網格。
如果還有人說老外的資料編織和資料網格沒有你說的那麼膚淺, 我覺得他們都是主資料+資料倉儲+資料中臺+資料資產管理平臺做一個有機的大整合,不過路徑不同。
你覺得呢?歡迎留言探討!
後續:
在翻譯資料網格這個概念的時候,注意到其定義裡面,用了一個單詞叫Socio-technical,特意翻了詞典叫社會技術系統,這個詞是什麼意思呢,特意查詢了百度百科:
建立社會技術系統,是指為了提高組織效益而採用同時集中於技術和社會兩方面的變革,使他們相互關係最佳配合的一種有計劃的組織變革方法。這種方法強調組織的技術和人的因素的最佳結合,強調對完成工作的方法重新設計。它是現代組織變革活動中較為流行的方法之一 。
都說每個單位就是一個小社會,這個社會不就是要管理嗎!這個定義告訴我們資料管理可不僅僅是技術,不僅僅是IT系統,要用社會的方法,建章立制,有管理辦法,有管理流程,有資料管理的專門角色和團隊,再輔以先進的IT系統才能把資料管理好!
作 者:馬歡,《DMBOK資料管理知識體系(第1&2版)》、《首席資料官管理手冊》等專著中文版主譯者,CDMP Master。
來自 “ DAMA資料管理 ”, 原文作者:馬歡;原文連結:https://mp.weixin.qq.com/s/d0z-MwfkARUAOMt5qnz1Aw,如有侵權,請聯絡管理員刪除。
相關文章
- 談談資料編織(Data Fabric)和資料網格(Data Mesh)的關係
- 什麼是資料編織"Data Fabric "?
- 資料網格與Data Fabric的區別 - thenewstack
- 談談如何從資料湖(Data Lake)架構轉向資料網格(Data Mesh)架構架構
- 死磕了老半天,終於讀懂了資料編織(Data Fabric)
- Data Fabric:資料管理的未來已來
- Data Mesh,一種新的資料架構理念!架構
- data dictionary(資料字典)
- Fabric動態增加組織【資料】
- Oracle Data Redaction資料加密Oracle加密
- 資料段data、bss、rodata
- WPF 資料模板Data Template
- 資料網格的編輯
- 【移動資料】data pump(上) 資料泵概述
- docker資料卷(Data Volumes)Docker
- data pump (資料抽取)測試
- CDM(Conceptual Data Model,概念資料模型)和 PDM(Physical Data Model,物理資料模型)模型
- Half-Edge-Mesh-Data-StructureStruct
- MySQL load data載入資料MySql
- 大資料去重(data deduplication)方案大資料
- Azure Data Factory(二)複製資料
- 資料恢復:FonePaw Data Recovery for Mac資料恢復Mac
- Data Guardian for Mac(資料加密工具)Mac加密
- XAML資料繫結(Data Binding)
- DATA GUARD手工管理資料檔案
- 使用data dump 恢復資料庫資料庫
- iOS Core Data 資料遷移 指南iOS
- XML資料島(XML Data Island) (轉)XML
- 利用Data vault對資料倉儲建模
- SAP MM 物料主資料的Document Data
- 閃回資料歸檔-- Flashback Data ArchiveHive
- oracle 資料泵 content=data_onlyOracle
- expdp impdp Data Pump(資料泵)使用解析
- BIG DATA 大資料時代來臨大資料
- 資料編織:交易資料和分析資料的橋樑【含示例】
- VMware Data Services Manager 2.1 - 資料庫管理和資料服務管理資料庫
- 什麼是非結構化資料(unstructured data)?Struct
- 使用Data Lake Analytics讀/寫RDS資料