增量資料載入
所講增量資料載入,舉例說A表為OLTP表,B表為OLAP表
ETL進行增量資料載入,抽取A表資料,並進行清洗、轉換、最後進行載入,執行過一次後,B表中就有了按規則抽取的資料,此後,當發生業務操作後,A表資料發生改變,即
1、增加
當A表增加資料後,經過ETL,僅抽取增加的資料,並進行相應轉換,B表中插入新增的資料
2、修改
當A表資料發生修改後,經過ETL,僅抽取修改過的資料,需要在B表中找到發生變化的資料,並進行相應的修改(不記錄修改歷史);或者在B表中找到發生變化的資料,並給這些資料置上歷史資料標識,並插入修改過的資料
3、刪除
當A表發生刪除時,經過ETL,B表應不發生任何變化,A表所刪除資料應仍然保持原有資料
這樣便實現了資料的增量抽取,遞增載入
ETL進行增量資料載入,抽取A表資料,並進行清洗、轉換、最後進行載入,執行過一次後,B表中就有了按規則抽取的資料,此後,當發生業務操作後,A表資料發生改變,即
1、增加
當A表增加資料後,經過ETL,僅抽取增加的資料,並進行相應轉換,B表中插入新增的資料
2、修改
當A表資料發生修改後,經過ETL,僅抽取修改過的資料,需要在B表中找到發生變化的資料,並進行相應的修改(不記錄修改歷史);或者在B表中找到發生變化的資料,並給這些資料置上歷史資料標識,並插入修改過的資料
3、刪除
當A表發生刪除時,經過ETL,B表應不發生任何變化,A表所刪除資料應仍然保持原有資料
這樣便實現了資料的增量抽取,遞增載入
在全表比對的方式下可以採用的漸變維的方式一般有兩種
1、不記錄歷史更改,即OLTP發生資料變化時,通過ETL同樣對
OLAP中資料進行修改
2、記錄歷史資訊,即OLTP發生資料變化時,通過ETL後,OLAP 中將保留原來資料,並不修改資料值,僅把該資料標識為 歷史資料,並把修改過的資料作為新資料插入OLAP表。這 種模式有三種方式進行歷史紀錄的記載
(1)版本號
即在OLAP表中增加欄位,記錄版本號,每次更新資料時, 記錄下當前版本號,以版本號最新表示記錄最新
(2)標誌欄位
即在OLAP表中增加欄位,記錄最新標識,例如1、0,把歷 史資料均置為1,當前最新資料為0
(3)時戳
即在OLAP表中增加時戳欄位,記錄資料的插入時間及更改 時間,以時間最後為最新紀錄
1、不記錄歷史更改,即OLTP發生資料變化時,通過ETL同樣對
OLAP中資料進行修改
2、記錄歷史資訊,即OLTP發生資料變化時,通過ETL後,OLAP 中將保留原來資料,並不修改資料值,僅把該資料標識為 歷史資料,並把修改過的資料作為新資料插入OLAP表。這 種模式有三種方式進行歷史紀錄的記載
(1)版本號
即在OLAP表中增加欄位,記錄版本號,每次更新資料時, 記錄下當前版本號,以版本號最新表示記錄最新
(2)標誌欄位
即在OLAP表中增加欄位,記錄最新標識,例如1、0,把歷 史資料均置為1,當前最新資料為0
(3)時戳
即在OLAP表中增加時戳欄位,記錄資料的插入時間及更改 時間,以時間最後為最新紀錄
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28573466/viewspace-772496/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 資料載入
- Mysql增量寫入Hdfs(一) --將Mysql資料寫入Kafka TopicMySqlKafka
- mysql資料庫之間、table增量匯入指令碼MySql資料庫指令碼
- 【sqlldr載入資料】SQL
- MySQL 資料庫增量資料恢復案例MySql資料庫資料恢復
- SQL SERVER收集資料庫使用增量資料SQLServer資料庫
- HBase載入大資料大資料
- ETL資料載入策略
- 圖片懶載入 與 下拉載入更新資料
- Docker入門-資料掛載Docker
- ListView動態載入資料View
- 外部表載入資料(ExternalTables)
- 利用CSV 引擎載入資料
- 增量資料丟失的原因分析
- 達夢dmfldr資料快速載入
- MySQL load data載入資料MySql
- Pytorch系列:(二)資料載入PyTorch
- WPFDataGrid效能載入大資料大資料
- 資料載入操作手冊
- MySQL load xml載入資料MySqlXML
- InnoDB資料字典--字典表載入
- js資料載入完成的方法JS
- Oracle資料載入速度優化Oracle優化
- AS 學習筆記 載入資料筆記
- Pytorch資料載入與使用PyTorch
- 增量資料丟失的原因分析(二)
- 增量資料丟失的原因分析(三)
- 配置GoldenGate增量資料同步機制Go
- Oracle增量匯入匯出Oracle
- 資料庫系列——基於Canal實現MySQL增量資料同步資料庫MySql
- [Flink/CDC/資料整合] 資料增量整合方案:Flink CDC
- 阿里 Canal 實時同步 MySQL 增量資料至 ClickHouse 資料庫阿里MySql資料庫
- List、Map、set的載入因子,預設初始容量和擴容增量
- 小程式預載入資料實戰
- 用SQL*Loader載入外部資料SQL
- tableView 載入資料完成的判斷View
- ajax無重新整理載入資料
- 後設資料值物件如何載入物件