論銀行的排程系統和ETL
批次排程功能:
2.批次排程現狀分析
ETL 排程:
ETL,是英文Extract-Transform-Load的縮寫,用來描述將資料從源端經過**抽取(extract)、轉換(transform)、載入(load)**至目的端的過程。ETL是將業務系統的資料經過抽取、清洗、轉換之後載入到資料倉儲的過程,目的是將企業中散亂、零亂、標準不同意的資料整個在一起。
ETL是資料倉儲的流水線,也可以認為是資料倉儲的血液,它維繫著資料倉儲中資料的新陳代謝,而資料倉儲日常的管理和維護工作大部分精力就是保持ETL的正常和穩定。
ETL,extract-transform-load
對應中文為抽取-清洗轉換-載入。
目的為將分佈的異構的資料來源的資料進行處理,最後載入到資料倉儲或資料集市中,成為後續分析的基礎。
ETL工具有OWB,DTS,informatic等。
資料抽取
資料拙取部分是將資料從各個不同的資料來源抽取到ODS(Operational Data Store,操作型資料儲存)中,在抽取的過程中需要挑選不同的抽取方法,儘可能地提高資料預處理的遠行效率。
如果已經並清楚了資料是從幾個業務系統中來,各個業務系統的資料庫伺服器遠行什麼DBMS,是否存在手工資料,手工資料量有多大,是否存在非結構化的資料等相關的資訊,就可以根據這些資訊開始進行資料抽取部分的設計。
資料轉換
資料轉換部分實際就是利用有關技術,如數理統計、資料探勘或預定義的資料轉換規則將源資料轉化成滿足資料質量要求的資料。
資料預處理中,花費時間最長的就是資料的轉換部分,一般情況下這部分的上作量要佔整個資料預處理的2/3。
在大多數情況下,資料轉換是將資料彙總,以位它更布意義。在轉換結構中,確保能找出一種最好的方法保證資料從傳統的資料儲存器到資料倉儲的同步。
資料載入
資料載入部分是將轉換後的資料載入到資料倉儲DW中。
資料載入策略包括載入週期和資料追加策略,資料載入週期要綜合考慮經營分析需求和系統訓載的代價,對不同業務系統的資料採用不同的載入週期,但必須保持間一時間業務資料的完整件和一致性。
ODS運算元據儲存,operational data store
儲存的是當前的資料情況,給使用者提供當前的狀態,提供即時性的、操作性的、整合的全體資訊的需求。
DW資料倉儲,data warehousing
資料倉儲是一個過程而不是一個專案,資料倉儲是一個環境,而不是一件產品。
資料倉儲提供使用者用於決策支援的當前和歷史資料,這些資料在傳統的操作型資料庫中很難或不能得到。
資料倉儲技術是為了有效的把操作形資料整合到統一的環境中以提供決策型資料訪問,的各種技術和模組的總稱。
所做的一切都是為了讓使用者更快更方便查詢所需要的資訊,提供決策支援。
DM資料集市,data mart
DM是DW的一部門,只是DM面向部門,DW面向整體。
資料集市是企業級資料倉儲的一個子集,他主要面向部門級業務,並且只面向某個特定的主題。
為了解決靈活性和效能之間的矛盾,資料集市就是資料倉儲體系結構中增加的一種小型的部門或工作組級別的資料倉儲。
資料集市儲存為特定使用者預先計算好的資料,從而滿足使用者對效能的需求。資料集市可以在一定程度上緩解訪問資料倉儲的瓶頸。
推薦閱讀:
1.
2.
3.:https://blog.csdn.net/qq_43528451/article/details/120416601
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69949806/viewspace-2900086/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- APS高階計劃排程系統和生產排產系統
- 07 系統排程
- 排程系統設計精要
- Android系統“資源排程框架”Android框架
- 詳解BI系統中的任務排程
- 實現一個分散式排程系統-LoadBalance和Ha策略分散式
- 系統架構設計之-任務排程系統的設計架構
- 作業系統綜合題之“採用實時排程,可排程的限制條件和可排程的最大X值是是多少ms的CPU時間”作業系統
- Java執行緒的排程Java執行緒
- 進擊的 Kubernetes 排程系統(一):Kubernetes scheduling frameworkFramework
- Schedule 排程系統設計(單機版)
- 利用Mesos構建多工排程系統
- iOS系統資源排程機制解析iOS
- Yarp 讓系統內排程更靈活
- 作業系統之排程演算法作業系統演算法
- Spark中資源排程和任務排程Spark
- WhaleScheduler為銀行業全信創環境打造統一排程管理平臺解決方案行業
- 世界銀行:在農業糧食系統中實現淨零排放
- libgo原始碼分析之多執行緒協程管理和排程Go原始碼執行緒
- 美團叢集排程系統的雲原生實踐
- 程序中的執行緒排程執行緒
- 阿里巴巴 Sigma 排程和叢集管理系統架構詳解阿里架構
- 作業系統精髓設計原理 程式排程作業系統
- 開源公開課丨大資料排程系統 Taier 任務排程介紹大資料AI
- Flink排程之排程器、排程策略、排程模式模式
- PassEncoder排程管線內的行為
- 智慧家居系統的匯流排系統和無線系統的具體介紹
- ModStart排程和佇列佇列
- ucore作業系統學習(六) ucore lab6執行緒排程器作業系統執行緒
- 【作業系統】4.程序排程演算法作業系統演算法
- 技術分享| 快對講綜合排程系統
- 解決方案| 快對講綜合排程系統
- 分散式任務排程系統設計小結分散式
- 例項分享| anyRTC 部署南京某區城市執行“一網統管”綜合排程系統
- 任務排程的思考和總結
- Go runtime 排程器精講(九):系統呼叫引起的搶佔Go
- 排隊論——隨機服務系統模擬精解隨機
- 商業銀行押品管理系統建設探索和實踐