A公司專注為各種規模和複雜程度的金融投資機構提供一體化投資管理系統，系統主要由投資組合管理、交易執行管理、實時監控管理、風險管理等功能模組構成。 隨著企業管理產品數量的不斷增多，大量資料分散在各券商系統中且資料儲存格式各異，難以管理和利用。

為幫助投資機構最大限度地提高投資決策和運營效率，A公司需要實時監控自己的使用者在各個交易平臺的基本資訊、餘額、訂單交易情況，並根據分析結果及時給出投資建議。

A公司的這種情況並不是個例。目前，越來越多的企業在資料傳輸的需求場景中，除了從上游不同業務資料庫中實時、定時分配到下游系統之外， 還有許多需求場景需要從外部合作商、供應商中獲取業務資料。

如果想要每天從企業外部系統中獲取資料，通常會採用什麼方法呢？

一些使用者給出的答案是： 根據需要編寫不同的指令碼，手動呼叫第三方系統提供的API介面，在抓取資料後，自行編寫清洗邏輯，最後實現資料落地。

然而隨著第三方系統的日益增多，如果按原有方式會帶來過多的指令碼維護成本和資料傳輸任務管理成本。為解決上述痛點， DataPipeline在新版本的資料同步任務中增加了 「自定義資料來源」功能，使用者可以透過上傳JAR包的方式自定義獲取資料邏輯。新功能支援任意的MySQL、Oracle、SQLServer、Hive、HBase等常見資料來源，冷門資料庫等（如騰訊雲TDSQL），常用的API呼叫，使用者自定義的SDK，或者透過Python抓取資料等。

「自定義資料來源」提供的價值