論銀行的排程系統和ETL
批次排程功能:
2.批次排程現狀分析
ETL 排程:
ETL,是英文Extract-Transform-Load的縮寫,用來描述將資料從源端經過**抽取(extract)、轉換(transform)、載入(load)**至目的端的過程。ETL是將業務系統的資料經過抽取、清洗、轉換之後載入到資料倉儲的過程,目的是將企業中散亂、零亂、標準不同意的資料整個在一起。
ETL是資料倉儲的流水線,也可以認為是資料倉儲的血液,它維繫著資料倉儲中資料的新陳代謝,而資料倉儲日常的管理和維護工作大部分精力就是保持ETL的正常和穩定。
ETL,extract-transform-load
對應中文為抽取-清洗轉換-載入。
目的為將分佈的異構的資料來源的資料進行處理,最後載入到資料倉儲或資料集市中,成為後續分析的基礎。
ETL工具有OWB,DTS,informatic等。
資料抽取
資料拙取部分是將資料從各個不同的資料來源抽取到ODS(Operational Data Store,操作型資料儲存)中,在抽取的過程中需要挑選不同的抽取方法,儘可能地提高資料預處理的遠行效率。
如果已經並清楚了資料是從幾個業務系統中來,各個業務系統的資料庫伺服器遠行什麼DBMS,是否存在手工資料,手工資料量有多大,是否存在非結構化的資料等相關的資訊,就可以根據這些資訊開始進行資料抽取部分的設計。
資料轉換
資料轉換部分實際就是利用有關技術,如數理統計、資料探勘或預定義的資料轉換規則將源資料轉化成滿足資料質量要求的資料。
資料預處理中,花費時間最長的就是資料的轉換部分,一般情況下這部分的上作量要佔整個資料預處理的2/3。
在大多數情況下,資料轉換是將資料彙總,以位它更布意義。在轉換結構中,確保能找出一種最好的方法保證資料從傳統的資料儲存器到資料倉儲的同步。
資料載入
資料載入部分是將轉換後的資料載入到資料倉儲DW中。
資料載入策略包括載入週期和資料追加策略,資料載入週期要綜合考慮經營分析需求和系統訓載的代價,對不同業務系統的資料採用不同的載入週期,但必須保持間一時間業務資料的完整件和一致性。
ODS運算元據儲存,operational data store
儲存的是當前的資料情況,給使用者提供當前的狀態,提供即時性的、操作性的、整合的全體資訊的需求。
DW資料倉儲,data warehousing
資料倉儲是一個過程而不是一個專案,資料倉儲是一個環境,而不是一件產品。
資料倉儲提供使用者用於決策支援的當前和歷史資料,這些資料在傳統的操作型資料庫中很難或不能得到。
資料倉儲技術是為了有效的把操作形資料整合到統一的環境中以提供決策型資料訪問,的各種技術和模組的總稱。
所做的一切都是為了讓使用者更快更方便查詢所需要的資訊,提供決策支援。
DM資料集市,data mart
DM是DW的一部門,只是DM面向部門,DW面向整體。
資料集市是企業級資料倉儲的一個子集,他主要面向部門級業務,並且只面向某個特定的主題。
為了解決靈活性和效能之間的矛盾,資料集市就是資料倉儲體系結構中增加的一種小型的部門或工作組級別的資料倉儲。
資料集市儲存為特定使用者預先計算好的資料,從而滿足使用者對效能的需求。資料集市可以在一定程度上緩解訪問資料倉儲的瓶頸。
推薦閱讀:
1.
2.
3.:https://blog.csdn.net/qq_43528451/article/details/120416601
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69949806/viewspace-2900086/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Quartz排程系統入門和排程高可用實現方案quartz
- 07 系統排程
- APS高階計劃排程系統和生產排產系統
- 排程系統設計精要
- linux 系統IO 排程Linux
- 談ERP系統的生產排程
- Java併發和多執行緒3:執行緒排程和有條件取消排程Java執行緒
- 【練習】銀行排號程式
- 詳解BI系統中的任務排程
- 時間系統、程式的排程與切換
- Android系統“資源排程框架”Android框架
- 【作業系統】--處理器排程作業系統
- 作業系統排程演算法作業系統演算法
- Spark中資源排程和任務排程Spark
- 作業系統綜合題之“採用實時排程,可排程的限制條件和可排程的最大X值是是多少ms的CPU時間”作業系統
- 系統架構設計之-任務排程系統的設計架構
- Java執行緒的排程Java執行緒
- 美團叢集排程系統的雲原生實踐
- RxJava 和 RxAndroid 五(執行緒排程)RxJavaAndroid執行緒
- Schedule 排程系統設計(單機版)
- 利用Mesos構建多工排程系統
- 作業系統之排程演算法作業系統演算法
- 0512作業系統之程式排程作業系統
- Hadoop - 任務排程系統比較Hadoop
- 實現一個分散式排程系統-LoadBalance和Ha策略分散式
- 世界銀行:在農業糧食系統中實現淨零排放
- 金融行業_銀行業務又論行業
- 程序中的執行緒排程執行緒
- 作業系統常用的排程演算法總結作業系統演算法
- linux系統中的排程週期任務:cronLinux
- linux系統中的排程延遲任務:at 命令Linux
- 【Spark篇】---Spark資源排程和任務排程Spark
- 作業系統精髓設計原理 程式排程作業系統
- 技術分享| 快對講綜合排程系統
- 解決方案| 快對講綜合排程系統
- Yarp 讓系統內排程更靈活
- 作業系統(5)處理器排程管理作業系統
- 0512 作業系統程式排程實驗作業系統