企業資料平臺建設的基石:構建統一的資料存算能力
隨著企業數字化程度的逐步提高,數字化業務對資料管理的需求也持續深化。根據企業本身所處的數字化程度不同,我們將企業的資料平臺的建設總結為五個階段,本篇我們對統一的資料儲存與算力做介紹。
— 統一的資料儲存與算力基礎概述 —
— 資料儲存與算力功能要求 —
資料存算基礎層是整個資料平臺層的基礎,因此企業在設計上要充分考慮對可能的業務形態的功能支撐能力,以及架構上的可持續演進能力。
— 資料儲存與算力架構要求 —
-
業務支撐層
-
高併發、高吞吐
資料應用普遍具有一些高併發或高吞吐的特性,如面向消費者的資料產品普遍有高併發的設計要求,而實時計算類應用的資料流轉與讀寫,在設計上一般都會保證吞吐量高,因此業務支撐層就需要保障對外服務的高併發和高吞吐。落實到技術上,一般資料平臺都有SQL編譯器、連線管理器等相關的模組,為應用提供併發的JDBC/ODBC連線和資料訪問能力,這也就要求SQL編譯器等模組有較高的效能。
-
高可用
由於資料應用大多是計算密集或者IO密集的,對資源消耗較大,為了保證平臺和應用的高可用,在架構上我們需要保證整體軟體棧的高可用性,即使在物理硬體出現問題的情況下,服務能夠正常執行。我們可以透過分散式軟體的高可用設計來保障平臺軟體層的高可用,再透過提供給應用層基於容器技術的應用編排技術來保障應用層的高可用。
-
鏈路安全管控
資料鏈路安全是企業軟體的基礎要求,包括常規的認證、授權和審計,還可能包括為了應用的功能性安全而採取的細粒度的安全策略管控,如資料應用按照白名單或黑名單來控制接入、提供資料訪問限流等措施。這要求所有的資料訪問介面和應用都能提供比較完善的資料安全架構設計。
-
儲存與計算層
-
分散式
分散式技術是整個大資料技術的核心,也是新的計算標準正規化。分散式儲存、分散式計算等技術是支撐行業數字化的基礎能力。
-
可擴充套件性
由於企業資料平臺是為了未來數十年的企業資料業務發展而設計的基礎層,因此平臺一定是隨著業務持續演進的,平臺無論是在橫向、縱向的可擴充套件性方面,還是架構本身的可擴充套件性上,都需要能夠做到較高的線效能力。橫向的可擴充套件性指的是可以透過增加伺服器數量來提升處理能力,無論是儲存平臺還是計算引擎,都需要支援從GB到PB級別的資料能力。縱向的可擴充套件性指的是可以透過單臺伺服器的資源提升來帶動效能提升。架構的可擴充套件性指的是未來有更強的新型計算和儲存能力,平臺上可以持續的增加新型別的儲存與計算引擎,從而滿足不停出現的新業務的需要。
-
多資料模型支援
企業內部的資料業務本身具有豐富的多樣性,支撐業務的資料型別也就具備多樣性。譬如經營管理類的資料一般以結構化的資料為主,而財務類資料應用就涉及大量的合同、票務單據等半結構化資料,生產製造類業務需要大量的時序資料類的能力支撐。因此企業級資料平臺就需要對多模型資料有很好的支撐能力,包括儲存、計算、查詢和生命週期管理等能力。
-
實時計算與批處理混合
早期的資料業務主要是資料倉儲和資料湖的建設,主要涉及資料的離線計算。近幾年實時類資料業務蓬勃發展,如工業製造類的故障檢測、銀行業的線上風控、智慧營銷等核心業務場景,因此對平臺的實時計算也有很高的要求。因此,資料平臺基礎層需要支援離線計算和實時計算模式,為新業務場景做好技術基礎。
-
資源管理層
-
多租戶能力
多租戶指的是一個平臺內可以按照不同的業務部門或組織單位劃分獨立的資源單位,每個資源單位內部署和執行的軟體使用不同的CPU、記憶體、磁碟等資源,相互隔離,因此不會互相爭搶硬體資源,從而保證不同部門應用的穩定性。此外由於各個部門的資料敏感性要求不一,資料持久化在不同的磁碟空間上,資料也有物理隔離性,因此可以為不同業務敏感度的資料提供不同的安全服務等級。
-
異構軟硬體管理
資源管理層的核心任務就是管理資料中心底層的軟硬體資源,隨著AI技術的發展,大量新型加速裝置如GPU成為資料中心的標配,此外摩爾定律持續推動半導體行業的發展,一個資料中心會出現多種資源配置的硬體資源,譬如部分伺服器儲存密度高,部分伺服器的記憶體密度高等。因此,資源管理層需要能夠統一有效的管理起這些異構的軟硬體環境,能夠按照業務的特點將應用下發到合適的伺服器上執行,提高基礎平臺層的執行效率。
-
多種生命週期的資料任務管理
從資源管理層的視角來看,資料任務分為短生命週期和長生命週期兩種。短生命週期任務包括類似機器學習模型訓練程式、資料ETL程式等,他們都是一次啟動完成計算後就結束,一般生命週期都是幾個小時以內甚至是秒級。長生命週期指的是7x24小時執行的資料應用,如對外服務的AI推理應用、移動APP的資料後臺服務等。早期的資料資源框架如Apache YARN都是針對短生命週期的任務的管理而設計的,不能支援長生命週期的任務。
-
國產軟硬體生態支援
國內企業需要能夠基於國產信創相關技術來構建整體的生態,平臺自身也需要滿足國產化的相關要求,當前這是一個強架構要求,尤其是國計民生相關的行業,如金融、能源、交通、政府等。
— 小結 —
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69994106/viewspace-2944068/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 企業級統一資料平臺建設思路
- vivo資料庫與儲存平臺的建設和探索資料庫
- 構建大資料平臺的必要性大資料
- 大資料分析平臺如何構建大資料
- 資料安全法正式實施,如何構建企業資料安全能力
- 圖資料庫平臺建設及業務落地資料庫
- 建設資料採集分析平臺,整合業務資料、消滅資料孤島
- TDS:標籤平臺+API平臺+資料共享平臺,助力資料運營平臺建設API
- 讀資料工程之道:設計和構建健壯的資料系統18資料儲存系統(上)
- 讀資料工程之道:設計和構建健壯的資料系統19資料儲存系統 (下)
- 使用 Flink Hudi 構建流式資料湖平臺
- RocketMQ Connect 構建流式資料處理平臺MQ
- 摩杜雲:構建資料中臺安全,保障企業核心資料安全
- 以資料為中心的資料安全基礎能力建設探索
- 讀資料工程之道:設計和構建健壯的資料系統20資料工程儲存抽象抽象
- 一文讀懂資料平臺建設的演進歷程
- 一張圖剖析企業大資料平臺的核心架構大資料架構
- 打造“資料金字塔”,小米大資料平臺建設之路大資料
- 案例|政務大資料平臺資料安全建設實踐大資料
- 淺談G行資料湖平臺建設
- 談PaaS平臺建設:如何應對企業架構多元異構資源的挑戰架構
- 銀行容器雲平臺建設的關鍵設計 | 資料
- 讀資料工程之道:設計和構建健壯的資料系統17儲存的原材料
- 伴魚基於 Flink 構建資料整合平臺的設計與實現
- 嗶哩嗶哩大資料平臺建設之路——資料安全篇大資料
- API管理平臺,構建企業統一介面管理API
- 美團圖資料庫平臺建設及業務實踐資料庫
- 將軍令:資料安全平臺建設實踐
- 作為資料應用場景基石的資料模型應該如何構建?Smartbi來教你!模型
- 構建企業CDC資料湖解決方案 -DZone
- 達觀資料助力浙江大華構建企業級知識搜尋共享平臺,盤活沉澱資料
- 美創解讀|《資料安全法》實施,企業資料安全合規技術能力建設
- 美創助力台州市大資料局“公共資料平臺”資料安全建設大資料
- 極光筆記|資料服務平臺一期建設筆記
- 敏捷開發框架的開發運用之大資料平臺的構建敏捷框架大資料
- 專訪科傑科技CEO於洋:湖倉一體資料底座,企業構建資料能力的“最優解” | 愛分析訪談
- 讀資料工程之道:設計和構建健壯的資料系統07資料架構的原則架構
- 構建資料庫雲管平臺 實現資料價值最大化資料庫