DataPipeline「自定義」資料來源,解決複雜請求邏輯外部資料獲取難題
一些使用者給出的答案是: 根據需要編寫不同的指令碼,手動呼叫第三方系統提供的API介面,在抓取資料後,自行編寫清洗邏輯,最後實現資料落地。
-
統一管理資料獲取邏輯,快速合併JAR減少指令碼開發量。 -
當上遊發生變化時,不需要對每一個資料傳輸任務進行調整。 -
可結合DataPipeline的資料解析功能、清洗工具和目標初始化功能減少整體開發量,並提供監控和預警。
-
建立自定義資料來源,並上傳JAR包(或調取已上傳過的JAR包)。 -
選擇資料存放的目的地。 -
使用清洗工具完成資料解析邏輯。 -
配置目的地表結構,即可完成所有配置。
1. 使用者在選擇自定義資料來源和目的地後,需要在讀取設定步驟中上傳JAR包
-
使用者可以上傳新的JAR包,也可以點選拖放框選擇歷史已經上傳的JAR用作本次任務。
-
使用者透過填充類路徑和讀取資料所需要的配置資訊即可完成資料來源讀取邏輯。
2. 使用者可以在一個任務中選擇一個或多個讀取物件,每個讀取物件可以對映到目標表的表中
3. 完成讀取設定後,在寫入設定步驟中先確定每個讀取物件的資料解析邏輯
-
DataPipeline會提供JSON解析樣例,使用者也可以參考樣例,自定義解析邏輯。
-
「樣例資料」模組會顯示透過讀取物件配置獲取的資料。 -
完成清洗指令碼內容後,在「執行結果」模組點選「試執行」即可看到最終寫入到目的地的資料格式。
4. 完成解析邏輯後,使用者可以手動新增名稱並選擇對應的資料型別 ,來完成目的地表結構
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31556703/viewspace-2675368/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 使用ajax請求傳送複雜的json資料型別,並解決fastjson解析複雜的json資料型別的問題JSON資料型別AST
- DataPipeline可以幫企業資料整合解決哪些核心難題?API
- 使用Python獲取HTTP請求頭資料PythonHTTP
- SparkSQL外部資料來源SparkSQL
- SAP Spartacus home 頁面讀取 product 資料的請求的 population 邏輯
- Spring多資料來源獲取Spring
- MVP -------簡單邏輯程式碼 -------難度2-----其中通過Handler請求資料MVP
- 如何將SQL寫成複雜邏輯 和構造資料SQL
- sbt配置——資料來源問題解決
- IE瀏覽器非同步請求無法獲取最新資料的解決方案瀏覽器非同步
- 狀態機解決複雜邏輯及使用
- 利用WITH MOVE語句獲取資料庫邏輯檔名BG資料庫
- 前端快取API請求資料前端快取API
- 自定義物件封裝資料警告解決物件封裝
- spring boot 自定義規則訪問獲取內部或者外部靜態資源圖片Spring Boot
- PostgreSQL邏輯複製資料同步到kafkaSQLKafka
- 爬蟲實戰:從HTTP請求獲取資料解析社群爬蟲HTTP
- 基於UNIX系統,邏輯故障的資料災難解讀
- Spark SQL:JSON資料來源複雜綜合案例實戰SparkSQLJSON
- Spark SQL:Hive資料來源複雜綜合案例實戰SparkSQLHive
- Spark SQL:JDBC資料來源複雜綜合案例實戰SparkSQLJDBC
- MYSQL資料庫複雜查詢練習題(難度適中)MySql資料庫
- 資料結構-邏輯關係&物理關係、時間複雜度、空間複雜度、順序表資料結構時間複雜度
- 過濾器中獲取form表單或url請求資料過濾器ORM
- 解決PHP Post獲取不到非表單資料的問題PHP
- Flask——請求資料Flask
- SpringMVC的資料獲取問題SpringMVC
- Postman模擬瀏覽器網頁請求並獲取網頁資料Postman瀏覽器網頁
- vue專案及axios請求獲取資料(cp網站搭建制作)VueiOS網站
- Spark SQL外部資料來源與實現機制SparkSQL
- 使用 SAP HANA Virtual Table 連線外部資料來源
- Http請求資料格式HTTP
- 請求資料處理
- Sanic request 請求資料
- 網路資料請求
- Jmeter 請求 websocket 獲得的響應資料不全JMeterWeb
- 複雜SQL構造資料:SQL
- 自定義資料型別資料型別