資料倉儲ODS、DW和DM概念 - 1
1. 資料倉儲分層
ODS——操作性資料
DW——資料倉儲
DM——資料集市
ods介面層採集資料的
dw 資料倉儲將介面採集的資料沉澱下來的
dm 資料集市將資料倉儲中的資料經過加工而來
2. 整體架構
各交易資料庫 -> ETL -> ODS -> DW -> 多個DM
各個系統透過ETL同步到操作性資料倉儲ODS中,對ODS資料進行面向主體域建模形成DW, DM是針對
某一個業務領域建立模型,具體使用者(一般為決策層)檢視DM生成的報表。
3. ODS,DW,DM概念
3.1 ODS
ODS - Operational Data Store,是資料倉儲體系結構中的一個可選部分。也叫做臨時儲存層。
它是“面向主題的、整合的、當前或接近當前的、不斷變化的”資料。
時效:實時或準實時
ODS應用場景
A. 在業務系統和資料倉儲之間形成一個隔離層,ODS直接存放從各個業務系統抽取過來的資料,
這些資料從結構和資料邏輯關係上和業務系統保持一致,降低了資料抽取的複雜性。它的存在
可以避免資料倉儲直接呼叫業務系統的資料。
B. 轉移一部分業務系統細節查詢的功能。因ODS存放的資料與業務系統相同,原來由業務系統
產生的報表,現在可以從ODS中產生了。
C. 完成資料倉儲中不能完成的一些功能。ODS存放的是明細資料,資料倉儲或DM存放的是匯聚
資料,ODS可提供查詢明細的功能。
資料來源源不斷寫入到ODS, 一經寫入的資料就不能被更改,鑑於這些特性,ODS一般會考慮使用
分散式檔案儲存系統。 ODS資料只能增加不能修改,資料是業務系統的原樣複製,可能存在資料
衝突的可能,解決方式是為每一條資料增加一個時間版本來區分相同的資料。
OLTP DB保留的是資料資訊的最新狀態,只有一個狀態。ODS支援OLTP型別的資料更新,資料更
新時間短,資料可實現準實時更新,效能與及時性都高於EDW 。ODS層的資料粒度是最細的,它
的歷史資料一般儲存3-6個月,以節省空間。如果量不大,有些可以儲存更長時間。
客戶等關鍵實體資料。ODS長久儲存當前資料,EDW長久儲存當前與歷史資料。
詳單資料。ODS儲存1個月到3個月;EDW儲存2年。
彙總資料。ODS儲存3年;EDW儲存5年。
其他資料。ODS儲存13個月;EDW儲存3年。
ODS主要面向營業、渠道等一線生產人員和一線管理人員,為了實現準實時、跨系統的運營細節
資料的查詢,以獲得細粒度的運營資料展現,例如渠道人員查詢客戶的全檢視資訊由ODS提供數
據支撐。ODS中也存在部分粗粒度彙總資料,但彙總的維度少且簡單。
ODS——操作性資料
DW——資料倉儲
DM——資料集市
ods介面層採集資料的
dw 資料倉儲將介面採集的資料沉澱下來的
dm 資料集市將資料倉儲中的資料經過加工而來
2. 整體架構
各交易資料庫 -> ETL -> ODS -> DW -> 多個DM
各個系統透過ETL同步到操作性資料倉儲ODS中,對ODS資料進行面向主體域建模形成DW, DM是針對
某一個業務領域建立模型,具體使用者(一般為決策層)檢視DM生成的報表。
3. ODS,DW,DM概念
3.1 ODS
ODS - Operational Data Store,是資料倉儲體系結構中的一個可選部分。也叫做臨時儲存層。
它是“面向主題的、整合的、當前或接近當前的、不斷變化的”資料。
時效:實時或準實時
ODS應用場景
A. 在業務系統和資料倉儲之間形成一個隔離層,ODS直接存放從各個業務系統抽取過來的資料,
這些資料從結構和資料邏輯關係上和業務系統保持一致,降低了資料抽取的複雜性。它的存在
可以避免資料倉儲直接呼叫業務系統的資料。
B. 轉移一部分業務系統細節查詢的功能。因ODS存放的資料與業務系統相同,原來由業務系統
產生的報表,現在可以從ODS中產生了。
C. 完成資料倉儲中不能完成的一些功能。ODS存放的是明細資料,資料倉儲或DM存放的是匯聚
資料,ODS可提供查詢明細的功能。
資料來源源不斷寫入到ODS, 一經寫入的資料就不能被更改,鑑於這些特性,ODS一般會考慮使用
分散式檔案儲存系統。 ODS資料只能增加不能修改,資料是業務系統的原樣複製,可能存在資料
衝突的可能,解決方式是為每一條資料增加一個時間版本來區分相同的資料。
OLTP DB保留的是資料資訊的最新狀態,只有一個狀態。ODS支援OLTP型別的資料更新,資料更
新時間短,資料可實現準實時更新,效能與及時性都高於EDW 。ODS層的資料粒度是最細的,它
的歷史資料一般儲存3-6個月,以節省空間。如果量不大,有些可以儲存更長時間。
客戶等關鍵實體資料。ODS長久儲存當前資料,EDW長久儲存當前與歷史資料。
詳單資料。ODS儲存1個月到3個月;EDW儲存2年。
彙總資料。ODS儲存3年;EDW儲存5年。
其他資料。ODS儲存13個月;EDW儲存3年。
ODS主要面向營業、渠道等一線生產人員和一線管理人員,為了實現準實時、跨系統的運營細節
資料的查詢,以獲得細粒度的運營資料展現,例如渠道人員查詢客戶的全檢視資訊由ODS提供數
據支撐。ODS中也存在部分粗粒度彙總資料,但彙總的維度少且簡單。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/35489/viewspace-2155540/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 資料倉儲ODS、DW和DM概念 - 2
- 資料倉儲ODS、DW和DM概念 - 3
- 資料倉儲ODS、DW和DM概念 - 4
- 關於資料倉儲 — ODS概念
- DW資料倉儲的一些概念
- 資料倉儲 ODS簡介
- 資料倉儲與ODS的區別
- ORACLE 資料倉儲概念Oracle
- ODS設計思路-ODS到DW同步
- 資料倉儲經驗概念
- 資料倉儲中的概念
- 資料倉儲設計的問題和重要概念
- 資料倉儲面試資料(基本概念)(轉)面試
- DW2.0下一代資料倉儲架構_第1章 遷資料倉儲簡史及第一代資料倉儲(讀書筆記)架構筆記
- 設計資料倉儲和資料倉儲的粒度
- DW2.0-下一代資料倉儲架構架構
- DW2.0下一代資料倉儲架構_第8章 資料模型和DW2.0(讀書筆記)架構模型筆記
- 資料倉儲分層概念之我見
- 資料倉儲入門之基本概念
- 資料庫和資料倉儲資料庫
- NoSQL 和資料倉儲SQL
- ODS與DW之間的關係
- 資料倉儲和商業智慧領域的又一部經典著作——《DW 2.0:下一代資料倉儲的構架》
- 資料倉儲和後設資料
- DW2.0下一代資料倉儲架構_第15章 DW2.0和效能(讀書筆記)架構筆記
- DW2.0下一代資料倉儲架構_第19章 DW2.0和非結構化資料(讀書筆記)架構筆記
- 談談資料湖和資料倉儲
- 淺談資料倉儲和大資料大資料
- 資料倉儲中商務智慧的基本概念
- 資料倉儲—資料倉儲—Sybase IQ 介紹
- DW2.0下一代資料倉儲架構_第17章 成本驗證和DW2.0(讀書筆記)架構筆記
- DW2.0下一代資料倉儲架構_第12章 DW2.0的資料流(讀書筆記)架構筆記
- 資料倉儲
- 資料湖 VS 資料倉儲之爭?阿里提出大資料架構新概念:湖倉一體阿里大資料架構
- 大資料和資料倉儲解決方案大資料
- OLAP和資料探勘——資料倉儲手冊
- DW2.0下一代資料倉儲架構_第7章 統計處理和DW2.0(讀書筆記)架構筆記
- DW2.0下一代資料倉儲架構_第4章 DW2.0中的後設資料(讀書筆記)架構筆記