論銀行的排程系統和ETL

mcxiaoracle發表於2022-06-11

批次排程功能:

2.批次排程現狀分析

2.1.目前主要實現方式

目前,由於銀行內部缺乏一款專業批次產品支撐,缺乏一定的批次排程規範與標準,使銀行內部幾十上百個系統相關批次排程實時混亂。這種現象不僅體現在銀行不同系統之間,甚至體現在同一系統的不同建設週期之間。

2.1.1.應用系統內建,手工排程排程

目前,在銀行內有很多系統的後臺批次處理,無論從後臺排程層面,還是前臺應用層面,都與業務系統本身高度耦合,而且排程觸發啟動主要是靠人工發起。造成這種局面的原因一方面是銀行缺乏統一的排程規範體系,另一方面,站在整個應用系統的角度,批次排程本身比重不大。

這種方案帶來的直接後果體現在兩個方面:一是因高度耦合,擴充套件不易;二是主要靠人工排程,相對較耗人力資源,而且因人工操作,可能會引入更多人為誤操作的風險。

2.1.2.採用作業系統Crontab方式排程

這種方式主要是依靠作業系統的定時機制,實現作業執行的自動化。這種方式容易引起依賴關係錯誤對業務構成威脅。同時,無法實現作業容錯機制,在執行過程,一旦發生作業錯誤,需大量的人工介入處理。

2.1.3.專案組自行開發排程軟體

該方案主要根據專案具體的需求以及結合排程的規模,設計並實施不同程度的排程。對於小規模的系統,通常編寫簡單的shell即可實時排程,弱化排程的管理性、監控性等潛在需求;對於規模較大的系統,實施者通常站在整個專案的高度,綜合分析專案的各種排程需求,透過一系列分析設計,構建一個相對規模的排程系統,並建立與之匹配的監控管理等應用系統。

此方案可由專案自由實施,可客戶化一些具有專案特色排程管理系統,與專案現有情況結合比較密切。但是,這種方案容易受專案的侷限,系統擴充套件也非常困難。

2.1.4.利用現有ETL工具的排程功能

隨著銀行資訊化發展,特別是資料倉儲的建立,並以此為基礎建立的更多資料類、管理類系統,或多或少都在採用一些專業的ETL工具來實現批次處理,並結合工具本身的排程元件完成相應批次排程處理工作。

工具舉例如下:






ETL 排程:

ETL,是英文Extract-Transform-Load的縮寫,用來描述將資料從源端經過**抽取(extract)、轉換(transform)、載入(load)**至目的端的過程。ETL是將業務系統的資料經過抽取、清洗、轉換之後載入到資料倉儲的過程,目的是將企業中散亂、零亂、標準不同意的資料整個在一起。


ETL是資料倉儲的流水線,也可以認為是資料倉儲的血液,它維繫著資料倉儲中資料的新陳代謝,而資料倉儲日常的管理和維護工作大部分精力就是保持ETL的正常和穩定。




ETL,extract-transform-load

對應中文為抽取-清洗轉換-載入。
目的為將分佈的異構的資料來源的資料進行處理,最後載入到資料倉儲或資料集市中,成為後續分析的基礎。
ETL工具有OWB,DTS,informatic等。

資料抽取

資料拙取部分是將資料從各個不同的資料來源抽取到ODS(Operational Data Store,操作型資料儲存)中,在抽取的過程中需要挑選不同的抽取方法,儘可能地提高資料預處理的遠行效率。
如果已經並清楚了資料是從幾個業務系統中來,各個業務系統的資料庫伺服器遠行什麼DBMS,是否存在手工資料,手工資料量有多大,是否存在非結構化的資料等相關的資訊,就可以根據這些資訊開始進行資料抽取部分的設計。

資料轉換

資料轉換部分實際就是利用有關技術,如數理統計、資料探勘或預定義的資料轉換規則將源資料轉化成滿足資料質量要求的資料。
資料預處理中,花費時間最長的就是資料的轉換部分,一般情況下這部分的上作量要佔整個資料預處理的2/3。
在大多數情況下,資料轉換是將資料彙總,以位它更布意義。在轉換結構中,確保能找出一種最好的方法保證資料從傳統的資料儲存器到資料倉儲的同步。

資料載入

資料載入部分是將轉換後的資料載入到資料倉儲DW中。
資料載入策略包括載入週期和資料追加策略,資料載入週期要綜合考慮經營分析需求和系統訓載的代價,對不同業務系統的資料採用不同的載入週期,但必須保持間一時間業務資料的完整件和一致性。

ODS運算元據儲存,operational data store

儲存的是當前的資料情況,給使用者提供當前的狀態,提供即時性的、操作性的、整合的全體資訊的需求。

DW資料倉儲,data warehousing

資料倉儲是一個過程而不是一個專案,資料倉儲是一個環境,而不是一件產品。
資料倉儲提供使用者用於決策支援的當前和歷史資料,這些資料在傳統的操作型資料庫中很難或不能得到。
資料倉儲技術是為了有效的把操作形資料整合到統一的環境中以提供決策型資料訪問,的各種技術和模組的總稱。
所做的一切都是為了讓使用者更快更方便查詢所需要的資訊,提供決策支援。

DM資料集市,data mart

DM是DW的一部門,只是DM面向部門,DW面向整體。
資料集市是企業級資料倉儲的一個子集,他主要面向部門級業務,並且只面向某個特定的主題。
為了解決靈活性和效能之間的矛盾,資料集市就是資料倉儲體系結構中增加的一種小型的部門或工作組級別的資料倉儲。
資料集市儲存為特定使用者預先計算好的資料,從而滿足使用者對效能的需求。資料集市可以在一定程度上緩解訪問資料倉儲的瓶頸。






推薦閱讀:

1.

2.

3.:https://blog.csdn.net/qq_43528451/article/details/120416601

4. https://blog.csdn.net/universsky2015/article/details/119965866?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-119965866-blog-106837202.pc_relevant_paycolumn_v3&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-119965866-blog-106837202.pc_relevant_paycolumn_v3&utm_relevant_index=1



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69949806/viewspace-2900086/,如需轉載,請註明出處,否則將追究法律責任。

相關文章