《離線和實時大資料開發實戰》(二)大資料平臺架構 & 技術概覽
前言
接著上一章 構建大資料開發知識體系圖譜,本次繼續分享邦中老師的《離線和實時大資料開發實戰》讀書筆記 。到底什麼樣的平臺才能算是大資料平臺呢?帶著這個問題,我們開始今天的內容 ( •̀ ω •́ )✧
什麼是資料平臺呢?或者更時髦點,什麼是大資料平臺呢?目前業界並沒有對資料平臺的精確定義,但通常所說的資料平臺主要包含以下三部分:
- 資料相關的工具、產品和技術:比如批量資料採集傳輸的 Sqoop 、離線資料處理 Hadoop 和 Hive 、實時流處理的 Storm、Spark 以及資料分析的 R 等;
- 資料資產:不僅包含公司業務本身產生和沉澱的資料,還包括公司運作產生的數(如財務、行政),以及從外界購買、交換或者爬蟲等而來的資料等;
- 資料管理:有了資料工具,也有了資料資產,但是還必須對它們進行管理才能讓資料產生最大價值並最小化風險,因此資料平臺通常還包括資料管理的相關概念和技術,如資料倉儲、資料建模、資料質量、資料規範、資料安全和後設資料管理等。
上面是對資料平臺邏輯範疇上的一個劃分,實際上資料平臺從資料處理的時效性角度,通常還是分為 離線資料平臺 和 實時資料平臺。
-
離線資料平臺通常以天為典型的資料處理週期,資料延遲也是以天為單位。離線資料平臺的資料應用主要以“看”為主
相關文章
- 大資料開發實戰:實時資料平臺和流計算大資料
- 大資料全系技術概覽大資料
- 七牛大資料平臺的實時資料分析實戰大資料
- 實戰大資料平臺開發架構講解,免費大資料教學視訊等你來拿大資料架構
- 美圖大資料平臺架構實踐大資料架構
- OPPO大資料離線計算平臺架構演進大資料架構
- 大資料引擎技術:2020版大資料教程Flink實時旅遊平臺限時送大資料
- 大資料技術概論大資料
- 大資料技術之大資料概論大資料
- 大資料平臺架構技術選型與場景運用大資料架構
- 王雨舟:知乎大資料平臺架構和實踐優化大資料架構優化
- DKHadoop大資料平臺架構詳解Hadoop大資料架構
- 大資料平臺架構設計探究大資料架構
- 大資料平臺核心架構圖鑑大資料架構
- 分析服務實時概覽資料助力開發者資料運營
- 餘利華:網易大資料平臺架構實踐分享!大資料架構
- 中科院“大資料探勘和分析技術實戰”公開課實訓大資料
- 百分點大資料技術團隊:輿情平臺架構實踐與演進大資料架構
- 【大資料】MapReduce開發小實戰大資料
- 資料視覺化平臺搭建,警務實戰平臺大資料應用視覺化大資料
- 如何設計實時資料平臺(技術篇)
- 有贊大資料離線叢集遷移實戰大資料
- 企業級大資料中臺架構實戰大資料架構
- 大資料平臺之大資料處理系統的架構大資料架構
- 實踐:大資料平臺1.0總結和2.0演化路線大資料
- 【Redis 技術探索】「資料遷移實戰」手把手教你如何實現線上 + 離線模式進行遷移Redis資料實戰指南(離線同步資料)Redis模式
- 大資料技術之Hadoop(入門)第1章 大資料概論大資料Hadoop
- 百分點大資料技術團隊:可插拔OSS架構設計和實戰經驗大資料架構
- 基於Hadoop的大資料平臺實施——整體架構設計Hadoop大資料架構
- 大資料平臺基礎架構hadoop安全分析大資料架構Hadoop
- 技術集錦 | 大資料雲原生技術實戰及最佳實踐系列大資料
- 企業級大資料中臺架構實戰【3】大資料架構
- 企業級大資料中臺架構實戰【1】大資料架構
- DataPipeline在大資料平臺的資料流實踐API大資料
- 大資料開發的儲存技術探索與實踐大資料
- Python技術棧與Spark交叉資料分析雙向整合技術實戰--大資料ML樣本集案例實戰PythonSpark大資料
- 我的《海量資料處理與大資料技術實戰》出版啦!大資料
- 開源大資料技術線上Meetup大資料