ETL工具----Kettle快速入門
不論是資料倉儲還是大資料,都需要用到ETL工具。
ETL(Extract-Transform-Load的縮寫,即資料抽取、轉換、裝載的過程)
1、Kettle概念
Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上執行,綠色無需安裝,資料抽取高效穩定。
Kettle 中文名稱叫水壺,該專案的主程式設計師MATT 希望把各種資料放到一個壺裡,然後以一種指定的格式流出。
Kettle這個ETL工具集,它允許你管理來自不同資料庫的資料,透過提供一個圖形化的使用者環境來描述你想做什麼,而不是你想怎麼做。
Kettle中有兩種指令碼檔案,transformation和job,transformation完成針對資料的基礎轉換,job則完成整個工作流的控制。
2、下載和部署
3、Kettle環境配置
1 安裝java JDK
1)首先到官網上下載對應JDK包,JDK1.7或以上版本就行;
2)安裝JDK;
3)配置環境變數,附配置方式:
安裝完成後,還要對它進行相關的配置才可以使用,先來設定一些環境變數,對於Java來說,最需要設定的環境變數是系統路徑變數path。
(1)要開啟環境變數的設定視窗。右擊“我的電腦”,在彈出的快捷選單中選擇“屬性”選項,進入“系統屬性”對話方塊,如圖所示。選擇“高階”標籤,進入“高階”選項卡,再單擊“環境變數”按鈕,進入“環境變數”對話方塊
(2)在“xxx的使用者變數”列表框中,新建“變數名”:"jdk_home"--新增jdk檔案目錄,如圖所示。
編輯完後,單擊“確定”按鈕,進行儲存,環境變數Path的設定就正式完成。
資料庫需要下載對就驅動包,如用MySQL需要到
http://dev.mysql.com/downloads/connector/j/
下載MySQL驅動包
放到
kettle解壓目錄\libswt\win32 or win64
3、2 測試JDK配置是否成功
設定好環境變數後,就可以對剛設定好的變數進行測試,並檢測Java是否可以執行。
(1)單擊“開始”按鈕,選擇“執行”選項,在“執行”對話方塊中輸入cmd命令。
(2)之後單擊“確定”按鈕,開啟命令列視窗。
(3)在游標處輸入:java -version命令,按下Enter鍵執行,即可看到測試結果
下面開始詳細步驟:
新建轉換
把“輸入”----“表輸入”拖到右邊框裡
雙擊表輸入
步驟名稱輸入:guo_testA
點 “新建” 新建資料庫連線
輸入連線資訊
測試連線是否成功
隨意寫一個sql語句,這個語句表示可以在這個庫中隨意組合,只要sql語句沒有錯誤即可,我這裡只是最簡單的把guo_testA中的所有資料查出來,語句為select * from guo_testA
接下來我們建立另外一個步驟【插入/ 更新】
然後在【表輸入】上同時按住shift鍵和滑鼠左鍵滑向【插入/ 更新】
新建資料庫連線guo_testB
配置“步驟名稱”、”資料庫連線“ 、“目標資料庫”
連線“表輸入”-->“插入/更新”
點選開始
新建--作業
把通用下的START、轉換拖到右邊
雙擊START設定時間間隔
雙擊轉換,新增轉換檔案路徑
點選開始、開始執行
至此,自動同步完成。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/26845409/viewspace-1986587/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- kettle從入門到精通 第五十五課 ETL之kettle Excel輸入Excel
- kettle從入門到精通 第五十一課 ETL之kettle Avro inputVR
- kettle從入門到精通 第五十六課 ETL之kettle Microsoft Excel OutputROSExcel
- kettle從入門到精通 第七十三課 ETL之kettle kettle呼叫http分頁介面教程HTTP
- kettle從入門到精通 第五十三課 ETL之kettle MQTT/RabbitMQ producer 實戰MQQT
- kettle從入門到精通 第五十七課 ETL之kettle呼叫儲存過程儲存過程
- kettle從入門到精通 第八十三課 ETL之kettle kettle呼叫python且接收返回值Python
- ETL 幾種工具的比較(Kettle,Talend,Informatica )ORM
- kettle從入門到精通 第七十課 ETL之kettle kettle資料校驗,髒資料清洗輕鬆拿捏
- kettle從入門到精通 第八十四課 ETL之kettle kettle中Get data from XML使用實戰教程XML
- kettle從入門到精通 第五十三課 ETL之kettle MQTT/RabbitMQ consumer實戰MQQT
- kettle從入門到精通 第六十九課 ETL之kettle kettle cdc mysql,輕鬆實現實時增量同步MySql
- 你還在用Kettle嗎?試試這款ETL工具
- kettle從入門到精通 第八十課 ETL之kettle kettle中的json物件欄位寫入postgresql中的json欄位JSON物件SQL
- kettle從入門到精通 第八十二課 ETL之kettle kettle中的【阻塞資料直到步驟都完成】使用教程
- kettle從入門到精通 第六十四課 ETL之kettle kettle中執行SQL指令碼步驟,使用需當心SQL指令碼
- ETL資料整合工具DataX、Kettle、ETLCloud特點對比Cloud
- RestCloud ETL與Kettle對比分析RESTCloud
- kettle從入門到精通 第六十六課 ETL之kettle kettle阻塞教程,輕鬆獲取最後一行資料,so easy
- ETL常用的三種工具介紹及對比Datastage、Informatica、KettleASTORM
- Charles抓包工具快速入門
- kettle從入門到精通 第七十二課 ETL之kettle 三談http post(含檔案上傳),徹底掌握引數傳遞HTTP
- 持續整合工具TeamCity快速入門
- TCE Bug管理工具快速入門
- ETL工具
- kettle從入門到精通 第六十五課 ETL之kettle 執行動態SQL語句,輕鬆實現全量&增量資料同步SQL
- 國產ETL工具 etl-engine
- ETL 是什麼 ETL 工具有哪些 ETL 工具對比 engine
- 快速排序快速入門排序
- airtest自動化測試工具快速入門AI
- 《Kettle構建Hadoop ETL系統實踐》簡介Hadoop
- ETL介紹與ETL工具比較
- 自學前端如何快速入門?怎麼快速入門前端?前端
- SQL快速入門 ( MySQL快速入門, MySQL參考, MySQL快速回顧 )MySql
- MySQL 快速入門MySql
- mysqlsla快速入門MySql
- Pipenv 快速入門
- Envoy 快速入門