數棧技術分享:到底什麼是資料中臺?終於有人說清楚了!

數棧DTinsight發表於2021-05-13

一、關於袋鼠雲和資料中臺

2017年杭州雲棲大會上,袋鼠雲正式將「資料中臺」作為自己的業務戰略方向。

2018年,袋鼠雲在業內率先推出 《袋鼠雲資料中臺專欄V1.0》,闡述自己的資料中臺理念和方法論。

2019年,袋鼠雲基於兩年來在資料中臺領域的探索和實踐經驗,推出 《袋鼠雲資料中臺專欄V2.0》升級版。

二、 資料中臺是理念,是方法論

【資料中臺】理念由阿里雲和袋鼠雲最先提出。

袋鼠雲依託最新的資料採集、加工處理、資料探勘、機器學習,深度學習等技術,並結合自身多年資料應用經驗,打造了袋鼠雲資料中臺解決方案,致力於構建“全”、“統”、“通”的大資料體系,基於「網際網路+」時代的資料價值思考,構建全域資料共享能力中心,助力企業數字化,提升企業競爭力!

資料中臺的實質是為企業構建「全域資料的共享能力中心」,提供資料採集、資料建模、資料研發、資料萃取、資料治理、資料服務等全鏈路一站式服務,構建面向業務應用的資料智慧平臺。

很多人會認為,【資料中臺】只是一個炒出來的詞彙,聽起來和傳統的資料倉儲沒有什麼不同啊。

針對這個問題,我們總結了「資料中臺」和「資料倉儲」的幾個明顯的優越性:

  • 分散式資料平臺
    傳統數倉以單機關係型資料庫離線分析為主;
    資料中臺以分散式引擎架構,同時支援離線計算/實時計算/即時計算/智慧計算。
  • 資料來源豐富性
    傳統數倉以業務資料庫的結構化資料為主;
    資料中臺涵蓋業務資料、日誌資料、行為埋點資料、IoT資料、爬蟲資料、外部資料等。
  • 建設模式方法論
    傳統數倉往往採用自頂向下的建設模式,以明確的業務分析驅動,延續性低;
    資料中臺採用自底向上的方式,結合業務需求變化不斷迭代升級。
  • 資料開發一站式
    傳統數倉往往將ODS、EDW和ETL開發切割到不同廠商工具實現;
    資料中臺則主張一站式視覺化資料開發,藉助分散式技術的力量簡化資料加工處理的過程。
  • 資料資產線上化
    傳統數倉的資料管理和治理,往往花費大量精力,最終形成的是離線的規範和文件;
    資料中臺則強調後設資料管理統一入口的自動化和資料資產管理的線上化。
  • 資料應用創新
    傳統數倉的資料應用以某個業務主題的BI報表和決策支援為主,相對來說目的性較為單一,而且各部門有不同的應用,建設方式呈煙囪式;
    資料中臺則主張打通資料孤島,建設全域資料,釋放資料應用創新的能量。

和傳統企業可能某一個IT部門去自建一個資料倉儲不同,今天我們談,企業構建資料中臺架構,是需要從集團戰略層面來規劃和推動的。在執行落地層面,則需要專業高階的人才,靠譜的合作廠商,完善的實施方法論,成熟的,低門檻的,高價效比的產品。

如果說,袋鼠雲資料中臺是方法論,是理念;那麼袋鼠雲數棧產品則是平臺、是生產力工具。兩者相輔相成,相互依託。

三、數棧則是工具,是產品

數棧是袋鼠雲推出的企業級一站式資料中臺PaaS,致力於遮蔽開源大資料引擎的複雜性,幫助使用者降低大資料技術門檻、沉澱企業資料資產、治理資料問題,提供集資料採集、資料模型、 資料計算和萃取、資料治理、資料資產、資料服務全鏈路的一站式產品,助力客戶高效、高質搭建自有的資料中臺。

四、企業建設資料中臺為什麼要選擇袋鼠雲數棧?

相比開源的其他廠商的大資料平臺架構,袋鼠雲數棧具有以下特性:

  • 一站式產品體系,覆蓋資料全鏈路開發流程
    平臺覆蓋全鏈路的資料採集、資料分析、資料探勘、任務運維、資料質量、資料地圖、資料模型、資料API開放等場景,充分滿足企業建設資料中臺過程中的多樣複雜需求。
  • 相容開放,與市面多種計算引擎相容
    相容市面主流大資料平臺,例如:Hadoop、Cloudera、Hortonworks、FusionInsight等,或者基於數棧自有計算引擎,可以快速完成大資料平臺從0到1的搭建。
  • 開箱即用,從入門到熟練開發僅需3天時間
    基於WEB的圖形化操作介面,快速上手,遮蔽底層複雜的基礎元件,極大降低企業大資料開發學習門檻,從入門到熟練開發僅需3天時間。
  • 彈性輕量,靈活匹配資料中臺階段性建設
    最小僅需5臺虛擬機器,企業已採購硬體不限硬體廠商、不限型號,不限使用年限,各功能模組可按需搭配,可靈活彈性建設資料中臺,降低企業一次性投入成本。





來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69995740/viewspace-2772058/,如需轉載,請註明出處,否則將追究法律責任。

相關文章