奈學:資料湖和資料倉儲的區別有哪些?
儲存方面:資料湖中資料為非結構化的,所有資料都保持原始形式;儲存所有資料,並且僅在分析時再進行轉換。資料倉儲就是資料通常從事務系統中提取,在將資料載入到資料倉儲之前,會對資料進行清理與轉換。
資料組織形式:資料湖就是捕獲半結構化和非結構化資料。而資料倉儲則是捕獲結構化資料並將其按模式組織。
用途:資料湖的目的就是資料湖非常適合深入分析的非結構化資料。資料科學家可能會用具有預測建模和統計分析等功能的高階分析工具。而資料倉儲就是資料倉儲非常適用於月度報告等操作用途,因為它具有高度結構化。
Schema:資料湖通常在儲存資料之後定義schema,使用較少的初始工作並提供更大的靈活性。在資料倉儲中儲存資料之前定義schema,這需要你清理和規範化資料,這意味著schema的靈活性要低不少。
本文來源於:奈學開發者社群
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69976612/viewspace-2700968/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 奈學:資料湖有哪些缺點?
- 資料倉儲、資料湖與湖倉一體的區別與聯絡
- 資料倉儲、資料集市、資料湖、資料中臺到底有什麼區別?
- 談談資料湖和資料倉儲
- 資料湖和中央資料倉儲的設計
- 資料湖+資料倉儲 = 資料湖庫架構架構
- 萬字詳解資料倉儲、資料湖、資料中臺和湖倉一體
- BI、資料倉儲和資料分析之間的區別
- 資料庫和資料倉儲的區別在哪兒?CN資料庫
- 資料倉儲與大資料的區別大資料
- 關於資料湖、資料倉儲的想法
- 資料湖會取代資料倉儲嗎?
- 資料湖 vs 資料倉儲 vs 資料庫資料庫
- BI, 資料倉儲,ETL, 資料開發,有什麼區別
- 資料倉儲被淘汰了?都怪資料湖
- 讀資料湖倉03不同型別的資料型別
- 資料倉儲資料中臺區別在哪?
- 有了資料湖,資料倉儲究竟能不能被取代?
- 資料湖 VS 資料倉儲之爭?阿里提出大資料架構新概念:湖倉一體阿里大資料架構
- 資料網格將替代資料倉儲或資料湖?- thenewstack
- 資料湖是下一代資料倉儲?
- 資料倉儲 vs 資料湖 vs 湖倉一體:如何基於自身資料策略,選擇最合適的資料管理方案?
- 通俗語言解釋資料倉儲、資料湖、資料中臺
- 一文讀懂:本地資料湖丨資料倉儲丨雲資料湖的利與弊
- 資料湖是誰?那資料倉儲又算什麼?
- 讀資料湖倉06資料整合
- 讀資料湖倉02資料抽象抽象
- 一文讀懂選擇資料湖還是資料倉儲
- 淺談資料倉儲和大資料大資料
- 【clickhouse專欄】資料庫、資料倉儲之間的區別與聯絡資料庫
- 讀資料湖倉01讓資料可信
- 資料湖 vs 倉庫 vs 資料庫資料庫
- 資料倉儲、資料集市、資料湖,你的企業更適合哪種資料管理架構?架構
- 讀資料湖倉05資料需要的層次
- 讀資料湖倉08資料架構的演化架構
- 資料湖與資料倉儲的根本區別,在於前者是“市場經濟”,而後者是“計劃經濟”
- 資料型別: 資料型別有哪些?資料型別
- 大資料和資料倉儲解決方案大資料