四種資料ETL模式(ZT)
四種資料ETL模式
根據模型的設計和源資料的情況,有四種資料ETL模式:完全重新整理、映象增量、事件增量、映象比較
[@more@]根據模型的設計和源資料的情況,有四種資料ETL模式:
完全重新整理:資料倉儲資料表中只包括最新的資料,每次載入均刪除原有資料,然後完全載入最新的源資料。這種模式下,資料抽取程式抽取源資料中的所有記錄,在載入前,將目標資料表清空,然後載入所有記錄。為提高刪除資料的速度,一般是採用Truncate清空資料表。如本系統中的入庫當前資訊表採用此種模式。
映象增量:源資料中的記錄定期更新,但記錄中包括記錄時間欄位,源資料中儲存了資料歷史的記錄,ETL可以透過記錄時間將增量資料從源資料抽取出來以附加的方式載入到資料倉儲中,資料的歷史記錄也會被保留在資料倉儲中。
事件增量:每一個記錄是一個新的事件,相互之間沒有必然的聯絡,新記錄不是對原有記錄數值的變更,記錄包括時間欄位,可以透過時間欄位將新增資料抽取出來載入到資料庫中。
映象比較:資料倉儲資料具有生效日期欄位以儲存資料的歷史資訊,而源資料不保留歷史並且每天都可能被更新。因此,只能將新的映象資料與上次載入的資料的映象進行比較,找出變更部分,更新歷史資料被更新記錄的生效終止日期,並新增變更後的資料。大多數源資料中需儲存歷史資訊的維表
原文連結:http://blogger.org.cn/blog/more.asp?name=xueflhg&id=6976
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7196059/viewspace-992903/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 資料整合的兩種架構:ELT和ETL架構
- 23種設計模式(四)-代理模式設計模式
- ETL資料整合平臺,RestCloud視覺化ETLRESTCloud視覺化
- Docker四種網路模式Docker模式
- Android四種啟動模式Android模式
- ETL資料整合,RestCloud資料整合平臺RESTCloud
- 國產 ETL工具 ETL產品 資料交換系統
- 四種設計模式詳解設計模式
- ETL的資料脫敏方式
- 大資料測試之ETL大資料
- [hive]hive資料模型中四種表Hive模型
- 四種大資料分析方法介紹!大資料
- 修改Oracle資料庫字符集(zt)Oracle資料庫
- SYBASE資料庫dbcc命令詳解(zt)資料庫
- java23種設計模式——四、原型模式Java設計模式原型
- 23種設計模式(四)- 模板方法設計模式設計模式
- ETL資料整合丨PostgreSQL資料遷移至Hive資料庫SQLHive資料庫
- LVS四種實現模式詳解模式
- 理解Android的四種啟動模式Android模式
- gRPC(2):四種基本通訊模式RPC模式
- ETL資料倉儲的使用方式
- RestCloud ETL WebService資料同步到本地RESTCloudWeb
- 資料庫的四種隔離級別資料庫
- 整理post提交資料的四種解析方式
- ETL是什麼?淺談ETL對資料倉儲的重要性
- JS 建立例項物件的四種模式JS物件模式
- OAuth2.0的四種授權模式OAuth模式
- 使用ETL進行資料接入的方式
- CRM系統的四種資料分析法
- 使用CRM系統資料分析的四種方法
- oracle 修改資料檔案路徑(四種方式)Oracle
- JavaScript資料型別判斷的四種方法JavaScript資料型別
- ETL資料整合丨將GreenPlum資料同步至Doris數倉
- 學會這四種Excel資料求和方法,還怕資料太多嗎?Excel
- LVS基礎-四種模式原理與實現模式
- ETL中後設資料處理的方式
- ETL+BI結合的資料整合工具
- ETL快速同步 用友u8資料方式
- 利用SSIS進行SharePoint 列表資料的ETL