四種資料ETL模式(ZT)
四種資料ETL模式
根據模型的設計和源資料的情況,有四種資料ETL模式:完全重新整理、映象增量、事件增量、映象比較
[@more@]根據模型的設計和源資料的情況,有四種資料ETL模式:
完全重新整理:資料倉儲資料表中只包括最新的資料,每次載入均刪除原有資料,然後完全載入最新的源資料。這種模式下,資料抽取程式抽取源資料中的所有記錄,在載入前,將目標資料表清空,然後載入所有記錄。為提高刪除資料的速度,一般是採用Truncate清空資料表。如本系統中的入庫當前資訊表採用此種模式。
映象增量:源資料中的記錄定期更新,但記錄中包括記錄時間欄位,源資料中儲存了資料歷史的記錄,ETL可以透過記錄時間將增量資料從源資料抽取出來以附加的方式載入到資料倉儲中,資料的歷史記錄也會被保留在資料倉儲中。
事件增量:每一個記錄是一個新的事件,相互之間沒有必然的聯絡,新記錄不是對原有記錄數值的變更,記錄包括時間欄位,可以透過時間欄位將新增資料抽取出來載入到資料庫中。
映象比較:資料倉儲資料具有生效日期欄位以儲存資料的歷史資訊,而源資料不保留歷史並且每天都可能被更新。因此,只能將新的映象資料與上次載入的資料的映象進行比較,找出變更部分,更新歷史資料被更新記錄的生效終止日期,並新增變更後的資料。大多數源資料中需儲存歷史資訊的維表
原文連結:http://blogger.org.cn/blog/more.asp?name=xueflhg&id=6976
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7196059/viewspace-992903/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 資料整合的兩種架構:ELT和ETL架構
- 提交資料四種方式
- ETL資料整合平臺,RestCloud視覺化ETLRESTCloud視覺化
- 國產 ETL工具 ETL產品 資料交換系統
- 23種設計模式(四)-代理模式設計模式
- ETL資料載入策略
- Docker四種網路模式Docker模式
- activity四種啟動模式模式
- ETL資料整合,RestCloud資料整合平臺RESTCloud
- 大資料測試之ETL大資料
- ETL的資料脫敏方式
- Android四種啟動模式Android模式
- 四種設計模式詳解設計模式
- oracle關閉的四種模式Oracle模式
- 大資料七種商業模式大資料模式
- [hive]hive資料模型中四種表Hive模型
- 四種大資料分析方法介紹!大資料
- 常用的四種大資料分析方法大資料
- [zt] 淺析資料庫的FOR XML的應用—RAW模式資料庫XML模式
- ETL資料整合丨PostgreSQL資料遷移至Hive資料庫SQLHive資料庫
- RestCloud ETL WebService資料同步到本地RESTCloudWeb
- 資料倉儲—ETL—Informatica 介紹ORM
- ETL資料倉儲的使用方式
- Windows 8磁碟的四種健康模式Windows模式
- EventBus四種執行緒交付模式執行緒模式
- 23種設計模式(四)- 模板方法設計模式設計模式
- java23種設計模式——四、原型模式Java設計模式原型
- redis資料庫叢集三種模式Redis資料庫模式
- 資料庫管理(ZT)資料庫
- 資料庫的四種隔離級別資料庫
- 整理post提交資料的四種解析方式
- 四種常見的 POST 提交資料方式
- 最常用的四種大資料分析方法大資料
- 實現web資料同步的四種方式Web
- 大資料帶來的四種思維大資料
- Android資料傳遞的四種方法Android
- 使用 jQuery dataTables - 2 四種資料來源jQuery
- Oracle資料庫的四種啟動方式Oracle資料庫