DataPipeline「自定義」資料來源,解決複雜請求邏輯外部資料獲取難題
一些使用者給出的答案是: 根據需要編寫不同的指令碼,手動呼叫第三方系統提供的API介面,在抓取資料後,自行編寫清洗邏輯,最後實現資料落地。
-
統一管理資料獲取邏輯,快速合併JAR減少指令碼開發量。 -
當上遊發生變化時,不需要對每一個資料傳輸任務進行調整。 -
可結合DataPipeline的資料解析功能、清洗工具和目標初始化功能減少整體開發量,並提供監控和預警。
-
建立自定義資料來源,並上傳JAR包(或調取已上傳過的JAR包)。 -
選擇資料存放的目的地。 -
使用清洗工具完成資料解析邏輯。 -
配置目的地表結構,即可完成所有配置。
1. 使用者在選擇自定義資料來源和目的地後,需要在讀取設定步驟中上傳JAR包
-
使用者可以上傳新的JAR包,也可以點選拖放框選擇歷史已經上傳的JAR用作本次任務。
-
使用者透過填充類路徑和讀取資料所需要的配置資訊即可完成資料來源讀取邏輯。
2. 使用者可以在一個任務中選擇一個或多個讀取物件,每個讀取物件可以對映到目標表的表中
3. 完成讀取設定後,在寫入設定步驟中先確定每個讀取物件的資料解析邏輯
-
DataPipeline會提供JSON解析樣例,使用者也可以參考樣例,自定義解析邏輯。
-
「樣例資料」模組會顯示透過讀取物件配置獲取的資料。 -
完成清洗指令碼內容後,在「執行結果」模組點選「試執行」即可看到最終寫入到目的地的資料格式。
4. 完成解析邏輯後,使用者可以手動新增名稱並選擇對應的資料型別 ,來完成目的地表結構
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31556703/viewspace-2675368/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 使用vue解決複雜邏輯Vue
- 使用ajax請求傳送複雜的json資料型別,並解決fastjson解析複雜的json資料型別的問題JSON資料型別AST
- SparkSQL外部資料來源SparkSQL
- DataPipeline可以幫企業資料整合解決哪些核心難題?API
- SAP Spartacus home 頁面讀取 product 資料的請求的 population 邏輯
- MVP -------簡單邏輯程式碼 -------難度2-----其中通過Handler請求資料MVP
- 如何將SQL寫成複雜邏輯 和構造資料SQL
- 二、傳送請求,獲取響應資料
- java發http,https請求獲取資料JavaHTTP
- Spring多資料來源獲取Spring
- 使用RxJava從多個資料來源獲取資料RxJava
- sbt配置——資料來源問題解決
- 狀態機解決複雜邏輯及使用
- IE瀏覽器非同步請求無法獲取最新資料的解決方案瀏覽器非同步
- 獲取v$latch資料來源實驗
- 在資料庫中自定義外部函式資料庫函式
- 利用WITH MOVE語句獲取資料庫邏輯檔名BG資料庫
- Spark SQL:Hive資料來源複雜綜合案例實戰SparkSQLHive
- Spark SQL:JDBC資料來源複雜綜合案例實戰SparkSQLJDBC
- 前端快取API請求資料前端快取API
- PostgreSQL邏輯複製資料同步到kafkaSQLKafka
- MDS:解決SOA的資料難題
- BW中自定義資料來源的Delta機制
- 自定義物件封裝資料警告解決物件封裝
- 爬蟲實戰:從HTTP請求獲取資料解析社群爬蟲HTTP
- Spark SQL:JSON資料來源複雜綜合案例實戰SparkSQLJSON
- 基於UNIX系統,邏輯故障的資料災難解讀
- MYSQL資料庫複雜查詢練習題(難度適中)MySql資料庫
- iOS請求的json資料解析錯誤問題解決iOSJSON
- java讀取請求中body資料Java
- iOS 網路請求資料快取iOS快取
- spring boot 自定義規則訪問獲取內部或者外部靜態資源圖片Spring Boot
- 請教weblogic資料來源使用問題Web
- 瞭解用於大資料解決方案的邏輯層大資料
- jquery實現的ajax請求獲取json資料程式碼jQueryJSON
- 過濾器中獲取form表單或url請求資料過濾器ORM
- 使用 Redis 解決“樹”形資料的複雜查詢Redis
- AngularJS中獲取資料來源的幾種方式AngularJS