sqoop定時增量匯入匯出

weixin_33941350發表於2015-08-14

OOP

sqoop定時增量匯入

2013-11-06 14:23 4553人閱讀評論(0) 收藏舉報

sqoop使用hsql來儲存job資訊，開啟metastor service將job資訊共享，所有node上的sqoop都可以執行同一個job

一、sqoop的配置檔案在sqoop.site.xml中：

1、sqoop.metastore.server.location

本地儲存路徑，預設在tmp下，改為其他路徑

2、sqoop.metastore.server.port

metastore service埠號

3、sqoop.metastore.client.autoconnect.url

sqoop自動連線的metastore地址，預設是本地的metastore地址

4、sqoop.metastore.client.enable.autoconnect

開啟自動連線。sqoop預設連線本地metastore。註釋這個配置會開啟自動連線。

二、開啟metastore service

sqoop下，nohup bin/sqoop metastore

三、建立job

sqoop支援兩種增量匯入模式，
一種是 append，即通過指定一個遞增的列，比如：
--incremental append --check-column num_iid --last-value 0

varchar型別的check欄位也可以通過這種方式增量匯入（ID為varchar型別的遞增數字）：

--incremental append --check-column ID --last-value 8
另種是可以根據時間戳，比如：
--incremental lastmodified --check-column created --last-value '2012-02-01 11:0:00'
就是隻匯入created 比'2012-02-01 11:0:00'更大的資料。

bin/sqoop job --meta-connect jdbc:hsqldb:hsql://10.106.1.234:16000/sqoop --create job_zyztest13 -- import --connect jdbc:oracle:thin:@10.106.1.236:1521:orcl --username SQOOP --password sqoop --table LXC_TEST_HBASE_TO_ORACLE --columns NAME,SEX,AGE,CSRQ -m 1 --hbase-table SQOOP_IMPORT_TEST3 --column-family info --hbase-row-key NAME --split-by NAME --incremental lastmodified --check-column CSRQ --last-value '2012-02-01 11:0:00' --verbose
nohup /opt/hadoopcluster/sqoop-1.4.2.bin__hadoop-2.0.0-alpha/bin/sqoop job --exec job_zyztest13 > job_zyztest13.out 2>&1 &

此時，在10.106.1.234上建立了job_zyztest13這個job，通過bin/sqoop job --meta-connect jdbc:hsqldb:hsql://10.106.1.234:16000/sqoop --list可以檢視所有job

四、定時執行

使用linux定時器：crontab -e

編輯定時器，新增*/4 * * * * /opt/hadoopcluster/sqoop-1.4.2.bin__hadoop-2.0.0-alpha/bin/sqoop job --meta-connect jdbc:hsqldb:hsql://10.106.1.234:16000/sqoop --exec job_zyztest13 > job_zyztest13.out 2>&1 & 任務將會每四分鐘執行一次

Oracle增量匯入匯出
2012-08-08
Oracle
sqoop資料匯入匯出
2018-09-10
OOP
sqoop部署及匯入與匯出
2018-06-13
OOP
sqoop用法之mysql與hive資料匯入匯出
2020-12-22
OOPMySqlHive
【匯入匯出】執行匯入，匯出時如何以as sysdba 身份連線。
2011-02-20
【匯出匯入】匯出匯入大物件
2010-08-16
物件
【匯入匯出】sqlldr 匯入案例
2011-03-09
SQL
資料搬運元件：基於Sqoop管理資料匯入和匯出
2021-03-15
元件OOP
【匯出匯入】% 在匯入匯出中的應用。
2011-03-16
Sqoop匯出ClickHouse資料到Hive
2023-02-06
OOPHive
sqoop匯入orcle注意事項
2019-05-11
OOP
Activity 流程模型匯入匯出-activity流程模型匯入匯出
2024-03-08
模型
Mysql匯入&匯出
2018-12-12
MySql
Mysql匯入匯出
2014-12-16
MySql
doris匯入匯出
2024-03-14
esayExcel匯入匯出
2024-11-05
Excel
【匯入匯出】Oracle 常用匯入匯出工具集錦
2015-03-27
Oracle
vue excel匯入匯出
2019-03-07
VueExcel
navlicat 匯入匯出SQL
2022-11-05
SQL
mysql 命令匯入匯出
2016-12-02
MySql
BCP匯入匯出MsSql
2013-07-19
SQL
mysql匯入匯出慢
2015-12-04
MySql
mysql 匯入、匯出命令
2007-07-19
MySql
Oracle資料庫匯入匯出。imp匯入命令和exp匯出命令
2022-03-01
Oracle資料庫
java匯出Excel定義匯出模板
2020-04-05
JavaExcel
Sqoop匯入資料異常處理
2019-01-30
OOP
Angular Excel 匯入與匯出
2019-04-17
AngularExcel
資料泵匯出匯入
2019-02-01
Oracle 資料匯入匯出
2018-06-14
Oracle
mysql資料匯入匯出
2014-11-10
MySql
mysql資料匯出匯入
2013-11-09
MySql
db2匯入匯出
2008-03-25
DB2
oracle排除表匯入匯出
2009-07-24
Oracle
.net6 匯入匯出
2024-06-26
Oracle資料匯入匯出
2024-07-23
Oracle
【docker】docker映象匯出匯入
2024-05-25
Docker
Export/Import匯入匯出時的字符集問題
2016-06-14
ExportImport
sqoop1.4.7環境搭建及mysql資料匯入匯出到hive
2019-01-30
OOPMySqlHive

sqoop定時增量匯入匯出

sqoop定時增量匯入

相關文章