資料編織:交易資料和分析資料的橋樑【含示例】
交易資料和分析資料之間的關係總是有點緊張。通常透過他們共同的朋友——資料管道進行交流。它至少穩定了二十年。但現在不安情緒正在增長。為什麼會這樣?首先,資料管道可能很慢。當交易資料到達資料平臺(如資料倉儲或資料湖)時,它已經過時了。因此,生成的洞察力可能不再相關。在當前敏捷業務時代,實時洞察力至關重要。其次,這是一條單向路線。價值從交易世界傳播到分析世界,但反之則不然。重要的是建立反饋迴路,以便生成的洞察力可以直接為交易世界做出貢獻。
傳統的資料平臺架構,如資料倉儲或資料湖,都沒有拉近這兩個世界。它們是為分析世界而構建的。即使是新的資料湖屋架構也會有同樣的缺陷。但是資料編織呢?
Gartner明確提到“資料編織涵蓋交易系統和分析系統”。資料編織就是鬆散耦合的分散式服務集合,使正確的資料能夠在正確的時間和地點以正確的形式從事務和分析性質的異構來源中獲得,跨任何雲和本地平臺,通常透過自助服務,同時滿足非功能性要求,包括成本效益、效能、治理、安全性和合規性。
但傳統上,這從未在資料平臺上完成過。它始終是分析資料世界獨有的。我們如何解決這個問題?我們如何將交易系統置於稱為資料編織的新資料平臺架構下?
影響企業的兩種技術趨勢
兩大技術趨勢正在影響全球的企業。首先是雲轉型。許多企業已將基礎架構和非業務關鍵型應用程式遷移到雲端,從而獲得了巨大的經濟利益。但這才剛剛開始。現在,關鍵業務應用程式正在實現更新,並準備好遷移到雲端。但在這種趨勢中,重點始終放在應用程式和基礎架構上。這些資料通常是經過深思熟慮後才出現的,有時甚至被忽略了。
第二個趨勢是以資料為中心。企業正試圖將自己轉變為一種基於資料執行其運營和流程的狀態。企業資料的原材料正在被提煉並轉化為資訊,然後是洞察力。我們的想法是,這些見解將推動業務決策,從而使業務收益對資產負債表的頂線和底線產生積極影響。
但這兩種趨勢存在於兩個平行的宇宙中。第一個通常是資料編織CIO資料編織的議程,而第二個通常是由多個資料編織CXO資料編織領導的業務議程。結果,他們沒有有效對接,失去了巨大的機會。
問題是我們能否在整體組織目標下將它們編織在一起?答案是肯定的。預計資料編織Data資料編織Fabric資料編織將在那裡發揮關鍵作用。讓我們看看如何。
與資料編織的融合
在雲轉型的當前階段,隨著關鍵業務應用程式的最佳化,出現了一個新的機會。幾乎所有的應用程式都與一個或多個資料庫相關聯。與應用程式一樣,這些資料庫也很陳舊,急需更新換代。否則無法獲得全部收益。然而,由於害怕出現新的問題,它們常常被忽視。與應用程式一起解決這個問題很重要。
在對這些資料庫進行改造時,可以採取多項措施:
•可以重新整理資料模型
•資料可以被清理
•龐大的單體資料庫可以分解成更小的可管理資料庫
•可以採用新的多語言技術(例如文件、鍵值對、圖形、物件儲存等),而不是使用舊的基於檔案或RDBMS資料技術
這種新改造的資料庫可以透過API、虛擬化、訊息傳遞等機制分享其資料。這些風險中的每一個都可以作為資料編織中的“資料資產”或“資料產品”釋出。發現和消費自然會隨之而來。
資料編織搭建橋樑
透過一個例子,讓我們看看事務和分析系統如何參與資料編織。
讓我們考慮一個零售組織。對於初始範圍,他們考慮了三個業務關鍵型交易系統。
•T 1是一個基於Java的自定義店面應用程式,可從移動和Web前端執行。
•T 2是零售商的財務和會計系統,採用SAP系統。
•T 3是Salesforce CRM。它還整合了Einstein以執行一些分析。
同樣在分析方面,除了上面提到的Einstein之外,讓我們在這個討論中包括更多的資料和人工智慧平臺。
•A 1是近年建立的客戶資料湖。它在Azure Databricks上執行。
•A 2是一箇舊的基於Netezza裝置的資料倉儲,用於處理財務和監管報告目的的資料集市。
•A 3是一個新的IBM Cloud Pak for Data基於分析平臺,用於開發新的人工智慧用例。
雖然基本系統很好地服務於此目的,但在過去幾年中,企業發現它們在市場上缺乏差異化。他們的創新在市場上並不是最好的。一個主要原因是缺乏可發現、可信賴和可使用的資料。他們的大部分資料整合都是點對點的。由於可發現性是一個問題,因此在整合和處理相同資料方面存在許多重複工作。
雖然最近CIO啟動了應用程式現代化計劃,但資料領域並未涵蓋其中。為了解決這種情況,CIO和CDO聯合發起了一個資料編織計劃。開發了一個企業資料市場,所有參與的交易和分析應用程式都應該釋出他們的“資料產品”。最初,上述六個系統被指定用於資料編織參與。讓我們看看這些系統將如何為這種參與而進行轉型。
T 1是一個古老的單一應用程式,被認為是最先進行現代化改造的應用程式之一。採用基於微服務的架構。大型Sybase資料庫被分成多個資料庫。主資料和參考資料主要儲存在Azure Cosmos DB中。事務資料儲存在SQL Server中。微服務作為API公開,供不同渠道使用。還發布了相同的API(例如,上圖中的“A”、“C”)。它還在市場上將原始銷售資料作為檔案產品“D”釋出。
T 2作為ERP,保持原樣。但是,它開始透過資料市場將定期賬戶資料作為檔案(圖中的產品“E”)釋出。A 2從市場中提取了這些檔案。
T 3開始透過資料流式釋出實時客戶資料變化。這些事件在市場上作為產品“F”釋出。T 1訂閱了這些事件以實時反映最新的客戶資料。同時,從Einstein的儲存庫中,Salesforce CRM的檔案提取作為產品“G”釋出。
A 1使用了原始銷售資料 ('D')和原始客戶資料 ('G')。它生成一致的客戶資料和一致的銷售資料,並將它們分別作為虛擬物件“H”和“I”釋出在市場上。
A 2攝取“I”和“E”並生成作為檔案產品“J”的對帳帳戶。
在A 3中,開發了一種用於個性化產品推薦的新AI模型。它使用一致的客戶和銷售資料、核對賬戶和實時客戶更新。經過訓練的推理模型部署為API“K”。T 1消費“K”以向店面的顧客提供更好的個性化推薦,從而創造更好的銷售。
結論
如上所述,Data Fabric在企業面前開闢了一種新的可能性,使他們的交易和分析資料更接近彼此。然而,這不僅僅是技術轉型,還需要組織和文化的轉變和變革。應用程式所有者和資料所有者需要在新的運營模型上合作。需要將資料視為一種產品,而不是一項複雜的技術。如果引入這樣的變化,企業可以獲得顯著的業務收益。
來自 “ 資料驅動智慧 ”, 原文作者:曉曉;原文連結:https://mp.weixin.qq.com/s/6yRe5T-EeX7BdCPmUn742g,如有侵權,請聯絡管理員刪除。
相關文章
- SQL與NoSQL,資料橋樑SqoopSQLOOP
- 挖掘資料隱含的業務資訊(1)——訂單銷售交易類資料分析
- CATIA 橋樑正向設計資料文章彙總
- 談談資料編織(Data Fabric)和資料網格(Data Mesh)的關係
- 資料編織 (Data Fabric) vs 資料網格 (Data Mesh)
- 織夢資料庫_織夢還原資料庫_織夢資料庫很卡資料庫
- 組織程式和資料
- OriginPro 2022: 資料與故事的智慧橋樑
- 什麼是資料編織"Data Fabric "?
- 淺析前端資料埋點監控:使用者行為與效能分析的橋樑前端
- 大資料、資料分析、資料探勘的差別大資料
- 織夢需要什麼資料庫織夢資料庫在哪資料庫
- 資料交易、資料權利與資料要素市場培育
- 資料探勘的資料分析方法
- 資料分析 | 資料清理的方法
- SD 組織資料
- 大資料分析有什麼含義大資料
- 以太坊原始碼分析(12)交易資料分析原始碼
- Spark ML包,資料探勘示例資料AffairsSparkAI
- 資料生態第四彈 | OpenMLDB Hive Connector,架構起資料倉儲到特徵工程的生態橋樑Hive架構特徵工程
- 資料模型與資料分析模型
- JTS相關資料和示例
- 資料分析之杜邦分析法的公式及示例公式
- 淺談大資料、資料分析、資料探勘的區別!大資料
- 全新物聯網資料整合 :Flow 視覺化編排 & 雙向資料橋接視覺化橋接
- 從零開始資料分析:一個資料分析師的資料分析流程
- 如何從資料庫提取海波龍的組織主資料資料庫
- BI、資料倉儲和資料分析之間的區別
- 資料分析--資料預處理
- 說說資料分析中的資料建模
- GBase XDM 資料庫ldapdelete命令講解和示例分析資料庫LDAdelete
- 選好“建材”,為一座座資料孤島搭起通車橋樑
- 資料:資料探勘綜述彙編
- TDSQL交易型分散式資料庫背景分析SQL分散式資料庫
- 2.9.6 資料庫中的示例資料庫
- 為VNPY增加資料庫記錄交易資料功能資料庫
- 資料分析
- 直接橋接資料型別橋接資料型別