ETL 幾種工具的比較(Kettle,Talend,Informatica )

studywell發表於2019-05-13

轉: https://blog.csdn.net/u012637358/article/details/82593092

ETL 幾種工具的比較(Kettle,Talend,Informatica )


成本:  
軟體成本包括多方面,主要包括軟體產品, 售前培訓, 售後諮詢, 技術支援等。 
開源產品本身是免費的,成本主要是培訓和諮詢,所以成本會一直維持在一個較低水平。 
商業產品本身價格很高,但是一般會提供幾次免費的諮詢或支援,所以採用商用軟體最初成本很高,但是逐漸下降。 
手工編碼最初成本不高,主要是人力成本,但後期維護的工作量會越來越大。

風險:  
專案都是有風險的尤其是大專案。 
專案的風險主要包括:超出預算,專案延期,沒有達到使用者的滿意和期望 
開源產品由於價格上的優勢,可以在很大程度上降低專案的風險。

易用性:  
Talend:有 GUI 圖形介面但是以 Eclipse 的外掛方式提供。 
Kettle:有非常容易使用的 GUI,出現問題可以到社群諮詢。 
Informatica:有非常容易使用的 GUI,但是要專門的訓練。 
Inaplex Inaport:沒有GUI

技術支援 : 
Talend:主要在美國 
Kettle:在美國,歐洲(比利時,德國,法國,英國),亞洲(中國,日本,韓國)都可以找到相關技術支援人員。 
Informatica:遍佈全世界 
Inaplex Inaport:主要在英國

部署:  
Talend:建立 java 或perl 檔案,並透過作業系統排程工具來執行 
Kettle:可以使用 job 作業方式或作業系統排程,來執行一個轉換檔案或作業檔案,也可以透過叢集的方式在多臺機器上部署。 
Informatica:需要有 Server 
Inaplex Inaport:需要 .net 2.0

速度:  
Talend:需要手工調整,對特定資料來源有最佳化知識。 
Kettle:比 Talend 快,不過也需要手工調整,對 Oracle 和 PostGre 等資料來源做了最佳化,同時也取決於轉換任務的設計。 
Informatica:是最快的 
Inaplex Inaport:沒有使用什麼最佳化技術。

資料質量:  
Talend:在 GUI 裡有資料質量特性,可以手工寫 SQL 語句。 
Kettle:在 GUI 裡有資料質量特性,可以手工寫 SQL 語句、java指令碼、正規表示式來完成資料清洗。 
Informatica:專門有一個產品 Informatica Data Quality 來保證資料質量 
Inaplex Inaport:因為只處理特定資料,所以比較容易進行資料清洗。

監控:  
Talend:有監控和日誌工具 
Kettle:有監控和日誌工具 
Informatica:有非常詳細的監控和日誌工具 
Inaplex Inaport:有監控和日誌工具

連線性:  
Talend:各種常用資料庫,檔案,web service。 
Kettle:非常廣泛的資料庫,檔案,另外可以透過外掛擴充套件。 
Informatica:各種資料來源 
Inaplex Inaport:ODBC 連線


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29519108/viewspace-2644089/,如需轉載,請註明出處,否則將追究法律責任。

相關文章