數棧技術分享:到底什麼是資料中臺?終於有人說清楚了!
一、關於袋鼠雲和資料中臺
2017年杭州雲棲大會上,袋鼠雲正式將「資料中臺」作為自己的業務戰略方向。
2018年,袋鼠雲在業內率先推出 《袋鼠雲資料中臺專欄V1.0》,闡述自己的資料中臺理念和方法論。
2019年,袋鼠雲基於兩年來在資料中臺領域的探索和實踐經驗,推出 《袋鼠雲資料中臺專欄V2.0》升級版。
二、 資料中臺是理念,是方法論
【資料中臺】理念由阿里雲和袋鼠雲最先提出。
袋鼠雲依託最新的資料採集、加工處理、資料探勘、機器學習,深度學習等技術,並結合自身多年資料應用經驗,打造了袋鼠雲資料中臺解決方案,致力於構建“全”、“統”、“通”的大資料體系,基於「網際網路+」時代的資料價值思考,構建全域資料共享能力中心,助力企業數字化,提升企業競爭力!
資料中臺的實質是為企業構建「全域資料的共享能力中心」,提供資料採集、資料建模、資料研發、資料萃取、資料治理、資料服務等全鏈路一站式服務,構建面向業務應用的資料智慧平臺。
很多人會認為,【資料中臺】只是一個炒出來的詞彙,聽起來和傳統的資料倉儲沒有什麼不同啊。
針對這個問題,我們總結了「資料中臺」和「資料倉儲」的幾個明顯的優越性:
-
分散式資料平臺
傳統數倉以單機關係型資料庫離線分析為主;
資料中臺以分散式引擎架構,同時支援離線計算/實時計算/即時計算/智慧計算。 -
資料來源豐富性
傳統數倉以業務資料庫的結構化資料為主;
資料中臺涵蓋業務資料、日誌資料、行為埋點資料、IoT資料、爬蟲資料、外部資料等。 -
建設模式方法論
傳統數倉往往採用自頂向下的建設模式,以明確的業務分析驅動,延續性低;
資料中臺採用自底向上的方式,結合業務需求變化不斷迭代升級。 -
資料開發一站式
傳統數倉往往將ODS、EDW和ETL開發切割到不同廠商工具實現;
資料中臺則主張一站式視覺化資料開發,藉助分散式技術的力量簡化資料加工處理的過程。 -
資料資產線上化
傳統數倉的資料管理和治理,往往花費大量精力,最終形成的是離線的規範和文件;
資料中臺則強調後設資料管理統一入口的自動化和資料資產管理的線上化。 -
資料應用創新
傳統數倉的資料應用以某個業務主題的BI報表和決策支援為主,相對來說目的性較為單一,而且各部門有不同的應用,建設方式呈煙囪式;
資料中臺則主張打通資料孤島,建設全域資料,釋放資料應用創新的能量。
和傳統企業可能某一個IT部門去自建一個資料倉儲不同,今天我們談,企業構建資料中臺架構,是需要從集團戰略層面來規劃和推動的。在執行落地層面,則需要專業高階的人才,靠譜的合作廠商,完善的實施方法論,成熟的,低門檻的,高價效比的產品。
如果說,袋鼠雲資料中臺是方法論,是理念;那麼袋鼠雲數棧產品則是平臺、是生產力工具。兩者相輔相成,相互依託。
三、數棧則是工具,是產品
數棧是袋鼠雲推出的企業級一站式資料中臺PaaS,致力於遮蔽開源大資料引擎的複雜性,幫助使用者降低大資料技術門檻、沉澱企業資料資產、治理資料問題,提供集資料採集、資料模型、 資料計算和萃取、資料治理、資料資產、資料服務全鏈路的一站式產品,助力客戶高效、高質搭建自有的資料中臺。
四、企業建設資料中臺為什麼要選擇袋鼠雲數棧?
相比開源的其他廠商的大資料平臺架構,袋鼠雲數棧具有以下特性:
-
一站式產品體系,覆蓋資料全鏈路開發流程
平臺覆蓋全鏈路的資料採集、資料分析、資料探勘、任務運維、資料質量、資料地圖、資料模型、資料API開放等場景,充分滿足企業建設資料中臺過程中的多樣複雜需求。 -
相容開放,與市面多種計算引擎相容
相容市面主流大資料平臺,例如:Hadoop、Cloudera、Hortonworks、FusionInsight等,或者基於數棧自有計算引擎,可以快速完成大資料平臺從0到1的搭建。 -
開箱即用,從入門到熟練開發僅需3天時間
基於WEB的圖形化操作介面,快速上手,遮蔽底層複雜的基礎元件,極大降低企業大資料開發學習門檻,從入門到熟練開發僅需3天時間。 -
彈性輕量,靈活匹配資料中臺階段性建設
最小僅需5臺虛擬機器,企業已採購硬體不限硬體廠商、不限型號,不限使用年限,各功能模組可按需搭配,可靈活彈性建設資料中臺,降低企業一次性投入成本。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69995740/viewspace-2772058/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 終於有人將資料中臺講清楚了,原來根本不算啥
- 到底什麼是資料中臺?
- 終於有人講清楚什麼是分析即服務(AaaS)
- 終於有人把Java記憶體模型說清楚了Java記憶體模型
- C#:終於有人把 ValueTask、IValueTaskSource、ManualResetValueTaskSourceCore 說清楚了!C#
- 分析即服務(AaaS)到底是什麼?終於有人講明白了
- 【教程】終於有人把Java記憶體模型說清楚了!Java記憶體模型
- 終於有人把MYSQL索引講清楚了MySql索引
- 什麼是資料中臺?什麼是數棲平臺?二者到底有什麼關係?
- 總是聽到有人說AndroidX,到底什麼是AndroidX?Android
- 五險一金終於有人給講清楚了
- VoNR來了,它到底是什麼技術?
- 索引失效底層原理分析,這麼多年終於有人講清楚了索引
- 終於有人把雲端計算、邊緣計算、霧計算說清楚了
- Kafka Network層解析,還是有人把它說清楚了Kafka
- 終於有人把ERP和OA的區別講清楚了!
- 資料中臺是什麼意思?如何建設資料中臺?
- 用語言 (非程式碼) 說清楚 IoC 到底是什麼
- 終於有人把Java記憶體區域說清楚了!(不是記憶體模型,不要再混淆了)Java記憶體模型
- 為什麼說資料服務是資料中臺的標配?
- BI和報表等於資料分析?終於有人講清楚了它們的區別
- 終於有人把安全知識圖譜技術講明白了(上篇)
- 前端技術分享:什麼是MongoDB資料庫?前端MongoDB資料庫
- 終於有人把機器學習中的文字摘要解釋清楚了!機器學習
- 企業的資料中臺到底指的是什麼?_光點科技
- 弄清楚,你要的到底是什麼
- 走好資料中臺最後一公里,為什麼說資料服務 API 是資料中臺的標配?API
- 數棧技術分享:數棧如何保障企業資料安全和隱私?
- 從資料中臺到AI中臺,企業到底要建什麼中臺?AI
- 工業裝置資料中臺是什麼?有什麼功能?
- Java技術分享:什麼是資料庫連線池?Java資料庫
- 資料中臺定義是什麼,作用有哪些?
- Continuous Integration 對 ABAP 技術棧來說意味著什麼
- 為什麼說阿里巴巴本身是雲上資料中臺的最佳實踐阿里
- Web前端技術分享:什麼是塊元素?什麼是行內元素?Web前端
- 20 張圖說清楚什麼是 IP 協議協議
- 你所聽到的技術原理、技術本質到底是什麼?
- 數棧產品分享:簡析資料中臺如何透過DataAPI實現資料共享API