sqoop指令碼批量生成

zyzloner發表於2019-02-16

原文網址 : https://flycode.co/archives/79458

通過all_tab_columnss字典表生成hive的建表語句

create or replace view create_sql as
–通過all_tab_columnss字典表生成hive的建表語句
select owner,table_name, case

     when nm = 1 then
      `create table ` || owner || `.` || TABLE_NAME || ` (` ||
      COLUMN_NAME || ` ` || DATA_TYPE || `,`
     when np = 1 then
      COLUMN_NAME || ` ` || DATA_TYPE || `) partitioned by (dt string);`
     else
      COLUMN_NAME || ` ` || DATA_TYPE || `,`
   end create_sql

from (

    SELECT OWNER,
            TABLE_NAME,
            COLUMN_NAME,
            CASE
              WHEN DATA_TYPE IN (`VARCHAR2`,`LONG`,`CLOB`,`CHAR`,`NCHAR`,`BLOB`,`VARCHAR2`) THEN
               `STRING`
              WHEN DATA_TYPE IN (`NUMBER`) then
               `DECIMAL` || `(` || DATA_PRECISION || `,` || DATA_SCALE || `)`
              WHEN DATA_TYPE IN (`DATE`, `TIMESTAMP(6)`) THEN
               `STRING`
              ELSE
               DATA_TYPE||`(` || DATA_PRECISION || `,` || DATA_SCALE || `)`
            END DATA_TYPE,
            COLUMN_ID,
            NM,
            NP
      FROM (select t.*,
                    row_number() over(partition by owner, TABLE_NAME order by COLUMN_ID) nm,
                    row_number() over(partition by owner, TABLE_NAME order by COLUMN_ID desc) np
             
               from all_tab_columns t
              ))

ORDER BY OWNER, TABLE_NAME, COLUMN_ID;

二、生成sqoop任務的配置表
select
owner||table_name job_name, –任務名稱
“ table_type, –表型別dim 維表，fact_i 只增，Fact_iud 增刪改
“ partition, –hive表是否是分割槽表 0 非，1 是
`BS` source_db, –來源業務系統，一般用源表使用者名稱或庫名
owner||`.`||table_name source_table, –源表名稱
“ datatime_cloumn, –增量時間戳欄位
`APPEND` incremental, –增量接入方式，append:增量接入，overwrite:全量接入
“ SPLIT_BY, –並行欄位，選擇重複資料較少的欄位
`APP_NO` row_key, –主鍵欄位
`fz_bs` hive_db, –指定接入的hive庫
table_name hive_table, –指定接入的hive表，必須是無資料庫名的存表名
“ check_column, –指定接入的源表欄位
columns
from (
select owner,table_name,wm_concat(column_name)over(partition by owner,table_name order by column_id) columns,rn from (
select owner,table_name,column_name,column_id,row_number()over(partition by owner,table_name order by column_id desc) rn from all_tab_column
where owner||`_`||table_name in(
`BS_S_FAULT_RPT`,
`BS_ARC_S_FAULT_RPT`,
`HIS_ARC_S_FAULT_RPT`,
`BS_S_FAULT_HANDLE`,
`BS_ARC_S_FAULT_HANDLE`,
`HIS_ARC_S_FAULT_HANDLE`,
`BS_S_RETVISIT`,
`BS_ARC_S_RETVISIT`,
`HIS_ARC_S_RETVISIT`,
`BS_S_95598_WKST_RELA`,
`HIS_S_95598_WKST_RELA`)
order by owner,table_name,column_id
))
where rn=1
order by owner,table_name;

下面是自動生成sqoop配置任務的的python指令碼

hive任務

!/usr/bin/python3

coding=utf-8

import json,os
def json_make(input_file=`./tablelist`):

#input_file =`./sqoopjob/tablelist`
lines = open(input_file, "r",encoding="utf_8_sig").readlines()
[lines.remove(i) for i in lines if i in [``, `
`]]
lines = [line.strip() for line in lines]

# 獲取鍵值
keys = lines[0].split(`	`)
line_num = 1
total_lines = len(lines)
parsed_datas = []
while line_num < total_lines:
        values = lines[line_num].split("	")
        parsed_datas.append(dict(zip(keys, values)))
        line_num = line_num + 1
json_str = json.dumps(parsed_datas, ensure_ascii=False, indent=4)
output_file = input_file+`.json`

# write to the file
f = open(output_file, "w", encoding="utf-8")
f.write(json_str)
f.close()
print(`json格式轉換結束！詳見%s`%(output_file))

def create_job(tablelist):

if os.path.exists(`sqoopjob`):
    os.system(`rm -fr sqoopjob/*`)
    os.system(`mkdir  sqoopjob/hive-bin`)
    os.system(`mkdir  sqoopjob/impala-bin`)
    os.system(`mkdir  sqoopjob/partition-bin`)
    os.system(`mkdir  sqoopjob/job-bin`)
else:
    os.mkdir(`sqoopjob`)
sqoopmeta=`jdbc:hsqldb:hsql://localhost:16000/sqoop`
jdbc=`jdbc:oracle:thin:@10.90.87.35:11521:bdccdb2 --username sqoopuser --password Bigdata_2016`
sjf=open(`sqoopjob/createjob.sh`, "w")
hcf = open(`./sqoopjob/hql_corntab.cron`, `w`)
imcf=open(`./sqoopjob/imql_corntab.cron`, `w`)
crontabf=open(`./sqoopjob/crontab.cron`, `w`)
df=open(`./sqoopjob/deletejob.sh`, `w`)
#scmd=open(`./sqoopjob/sqoopcmd.sh`, `w`)
#scmd.write(```yesdate=`date -d last-day +%Y-%m-%d`;todday=`date +%Y-%m-%d````)
#cf=open(`./sqoopjob/cron.sh`, `w`)
kerboros=`kinit -kt /keytab/sqoopdba.keytab sqoopdba 
`

with open(tablelist, `r`) as load_f:
    load_dict = json.load(load_f)
    for job in load_dict:
        if job[`table_type`].lower()==`dim` and job[`partition`]==`0`:
            #處理檔案表
            hivetruncate=```hive -e"use {hive_db};truncate table {hive_table}_new"
```.format(hive_db=job[`hive_db`],hive_table=job[`hive_table`])
            createjob = ```sqoop  job --create {job_name} --meta-connect {sqoopmeta} \
                    -- import --connect {jdbc} \
                    --table {source_table} \
                    --incremental append \
                    --split-by {split_by} \
                    --hive-import \
                    --hive-drop-import-delims \
                    --hive-overwrite \
                    --hive-table {hive_db}.{hive_table}_NEW \
                    --check-column  {check_column} \
                    --last-value `2011-01-01 11:00:00` \
                    -m 2;
```.format(
                    job_name=job[`job_name`].lower(),
                    sqoopmeta=sqoopmeta,
                    jdbc=jdbc,
                    hive_db=job[`hive_db`],
                    source_table=job[`source_table`].upper(),
                    split_by=job[`split_by`].upper(),
                    hive_table=job[`hive_table`].upper(),
                    check_column=job[`datatime_cloumn`].upper()
                    ).replace(`    `,``)

            execjob = ```sqoop  job --meta-connect jdbc:hsqldb:hsql://localhost:16000/sqoop 
                    --exec {job_name};
```.format(job_name=job[`job_name`].lower()).replace(`    `,``)

            deledrop = ```sqoop  job --meta-connect jdbc:hsqldb:hsql://localhost:16000/sqoop 
                    --delete {job_name};
```.format(job_name=job[`job_name`].lower() ).replace(`    `,``)

            hql = ```hive -e "use {hive_db};
                create table {tmp_table} as
                select {columns} from
                (select t.*,row_number()over(partition by {pattition_by} ORDER BY  t.{order_by} desc) as rn
                from (select * from {table_name}_new union all select * from {table_name}) t
                ) tm
                where rn =1;
                drop table {table_name};
                alter table {table_name}_TMP rename to {table_name};
                "
```.format(
                                    hive_db=job[`hive_db`],
                                    tmp_table=job[`source_table`].replace(`.`, `_`)+`_tmp`,
                                    columns=job[`columns`],
                                    pattition_by=`,`.join([`t.` + cl for cl in job[`pattition_by`].split(`,`)]),
                                    order_by=job[`datatime_cloumn`],
                                    table_name=job[`source_table`].replace(`.`, `_`),
                                    ).replace(`    `,``)
            imql = ```impala-shell -i bigdata-w-001 -q "invalidate metadata;use {hive_db};
                create table {tmp_table} as
                select {columns} from
                (select t.*,row_number()over(partition by {pattition_by} ORDER BY  t.{order_by} desc) as rn
                from (select * from {table_name}_new union all select * from {table_name}) t
                ) tm
                where rn =1;
                drop table {table_name};
                alter table {table_name}_TMP rename to {table_name};
                "
```.format(
                                    hive_db=job[`hive_db`],
                                    tmp_table=job[`source_table`].replace(`.`, `_`) + `_tmp`,
                                    columns=job[`columns`],
                                    pattition_by=`,`.join([`t.` + cl for cl in job[`pattition_by`].split(`,`)]),
                                    order_by=job[`datatime_cloumn`],
                                    table_name=job[`source_table`].replace(`.`, `_`),
                                ).replace(`    `,``)
            #print(sjf)
            sjf.write(hivetruncate+createjob)
            df.write(deledrop)
            open(`./sqoopjob/hive-bin/` + job[`job_name`].lower() + `_hql.sh`, `w`).write(kerboros + execjob  + hql)
            open(`./sqoopjob/impala-bin/` + job[`job_name`].lower() + `_imql.sh`, `w`).write(kerboros + execjob  + imql)
            hcf.write(```30 02 * * 6 cd /root/hive_import/bin&& ./{job_name}_hql.sh >>../logs/{job_name}_hql.out 2>&1
```.format(
                job_name=job[`job_name`].lower()
                    )
                    )
            imcf.write(
            ```30 02 * * 6 cd /root/hive_import/bin&& ./{job_name}_imql.sh >>../logs/{job_name}_imql.out 2>&1
```.format(
                job_name=job[`job_name`].lower()))
            execjob = ```sqoop  job --meta-connect jdbc:hsqldb:hsql://localhost:16000/sqoop 
                    --exec {job_name};
```.format(
                job_name=job[`job_name`].lower()).replace(`    `,``)
            open(`./sqoopjob/exec_run.sh`, `a`).write(execjob)
        elif job[`table_type`].lower()==`fact_iud`and job[`partition`]==`0`:
            # 處理增量事實表,有增刪改查的事實表
            hivetruncate = ```hive -e"use {hive_db};truncate table {hive_table}"
```.format(
                hive_db=job[`hive_db`], hive_table=job[`hive_table`])
            createjob = ```sqoop  job --create {job_name} --meta-connect {sqoopmeta} \
                    -- import --connect {jdbc} \
                    --table {source_table} \
                    --split-by {split_by} \
                    --hive-import \
                    --hive-drop-import-delims \
                    --hive-table {hive_db}.{hive_table} \
                    --delete-target-dir \
                    -m 2;
```.format(
                                            job_name=job[`job_name`].lower(),
                                            sqoopmeta=sqoopmeta,
                                            jdbc=jdbc,
                                            hive_db=job[`hive_db`],
                                            source_table=job[`source_table`].upper(),
                                            split_by=job[`split_by`].upper(),
                                            hive_table=job[`hive_table`].upper(),
                                        ).replace(`    `,``)
            sjf.write(hivetruncate+createjob)
            execjob = ```sqoop  job --meta-connect jdbc:hsqldb:hsql://localhost:16000/sqoop 
                                    --exec {job_name};
```.format(job_name=job[`job_name`].lower()).replace(`    `,
                                                                                                             ``)
            open(`./sqoopjob/job-bin/` + job[`job_name`].lower() + `.sh`, `w`).write(kerboros + execjob)
            open(`./sqoopjob/exec_run.sh`, `a`).write(execjob)
            crontabf.write(```30 02 * * 6 cd /root/hive_import/bin&& ./{job_name}.sh >>../logs/{job_name}.out 2>&1
```.format(
                    job_name=job[`job_name`].lower()))
        elif job[`table_type`].lower()==`fact_i`and job[`partition`]==`0`:
            # 處理線上事實表,只有寫入事務的事實表
            hivetruncate = ```hive -e"use {hive_db};truncate table {hive_table}"
```.format(
                hive_db=job[`hive_db`], hive_table=job[`hive_table`])
            createjob = ```sqoop  job --create {job_name} --meta-connect {sqoopmeta} \
                                    -- import --connect {jdbc} \
                                    --table {source_table} \
                                    --incremental append \
                                    --split-by {split_by} \
                                    --hive-import \
                                    --hive-drop-import-delims \
                                    --hive-table {hive_db}.{hive_table} \
                                    --check-column  {check_column} \
                                    --last-value `2011-01-01 11:00:00` \
                                    -m 2;
```.format(
                                                                job_name=job[`job_name`].lower(),
                                                                sqoopmeta=sqoopmeta,
                                                                jdbc=jdbc,
                                                                hive_db=job[`hive_db`],
                                                                source_table=job[`source_table`].upper(),
                                                                split_by=job[`split_by`].upper(),
                                                                hive_table=job[`hive_table`].upper(),
                                                                check_column=job[`datatime_cloumn`].upper()
                                                            ).replace(`    `, ``)
            sjf.write(hivetruncate+createjob)
            execjob = ```sqoop  job --meta-connect jdbc:hsqldb:hsql://localhost:16000/sqoop 
                    --exec {job_name};
```.format(job_name=job[`job_name`].lower()).replace(`    `, ``)
            open(`./sqoopjob/job-bin/` + job[`job_name`].lower() + `.sh`, `w`).write(kerboros + execjob)
            open(`./sqoopjob/exec_run.sh`, `a`).write(execjob)
            crontabf.write(```30 02 * * 6 cd /root/hive_import/bin&& ./{job_name}.sh >>../logs/{job_name}.out 2>&1
```.format(
                    job_name=job[`job_name`].lower()))


        elif job[`partition`]==`1` and job[`table_type`] in [`fact_i`,`fact_iud`]:
            #處理帶有where條件查詢資料
            shell_cmd=```if [ $# -gt 1 ]; then
                        yesdate=$1
                        today=$2
                        var_len1=`echo ${yesdate} |wc -L`
                        var_len2=`echo ${today} |wc -L`
                        if [[ ${var_len1} != 10 || ${var_len2} != 10 ]];then
                            echo `vars is wrong`
                            echo `var input like:2017-01-01 2017-01-21`
                            exit
                        fi
                    else
                        yesdate=`date -d "today -1 day " +%Y-%m-%d`
                        today=`date -d today +%Y-%m-%d`
                    fi

                echo "data:${yesdate}  ${today}"
```.replace(`    `,` `)
            createjob = ```hive -e"use {hive_db};alter table {hive_table} drop if  exists  partition (dt=`$yesdate`);
                    alter table {hive_table} add partition(dt=`$yesdate`) "
                    sqoop  import --connect {jdbc} \
                    --table {source_table} \
                    --where "{where} >= date`$yesdate` and {where}<date`$today` " \
                    --split-by {split_by} \
                    --hive-import \
                    --hive-partition-key dt  \
                    --hive-partition-value  $yesdate \
                    --hive-drop-import-delims \
                    --hive-table {hive_db}.{hive_table} \
                    --delete-target-dir \
                    -m 2;
```.format(
                                            job_name=job[`job_name`].lower(),
                                            hive_db=job[`hive_db`],
                                            sqoopmeta=sqoopmeta,
                                            jdbc=jdbc,
                                            source_table=job[`source_table`].upper(),
                                            where=job[`datatime_cloumn`],
                                            split_by=job[`split_by`].upper(),
                                            hive_table=job[`hive_table`].upper(),
                                        ).replace(`    `,``)
            #scmd.write(createjob)
            open(`./sqoopjob/partition-bin/`+job[`job_name`].lower()+`.sh`, `w`).write(shell_cmd+createjob)
            open(`./sqoopjob/exec_run.sh`, `a`).write(shell_cmd+createjob)
            crontabf.write(
                ```30 02 * * 6 cd /root/hive_import/bin&& ./{job_name}.sh >>../logs/{job_name}.out 2>&1
```.format(
                    job_name=job[`job_name`].lower()))
        elif job[`partition`] == `1` and job[`table_type`] in [`dim`]:
            # 處理帶有where條件查詢資料
            shell_cmd = ```if [ $# -gt 1 ]; then
                    yesdate=$1
                    today=$2
                    var_len1=`echo ${yesdate} |wc -L`
                    var_len2=`echo ${today} |wc -L`
                    if [[ ${var_len1} != 10 || ${var_len2} != 10 ]];then
                        echo `vars is wrong`
                        echo `var input like:2017-01-01 2017-01-21`
                        exit
                    fi
                else
                    yesdate=`date -d "today -1 day " +%Y-%m-%d`
                    today=`date -d today +%Y-%m-%d`
                fi

            echo "data:${yesdate}  ${today}"
```.replace(`    `,` `)
            createjob = ```hive -e"use {hive_db};alter table {hive_table} drop if  exists  partition (dt=`$yesdate`);
                       alter table {hive_table} add partition(dt=`$yesdate`) "
                       sqoop  import --connect {jdbc} \
                       --table {source_table} \
                       --split-by {split_by} \
                       --hive-import \
                       --hive-partition-key dt  \
                       --hive-partition-value  $yesdate \
                       --hive-drop-import-delims \
                       --hive-table {hive_db}.{hive_table} \
                       --delete-target-dir \
                       -m 2;
```.format(
                                                job_name=job[`job_name`].lower(),
                                                hive_db=job[`hive_db`],
                                                sqoopmeta=sqoopmeta,
                                                jdbc=jdbc,
                                                source_table=job[`source_table`].upper(),
                                                where=job[`datatime_cloumn`],
                                                split_by=job[`split_by`].upper(),
                                                hive_table=job[`hive_table`].upper(),
                                                ).replace(`    `, ``)
            #scmd.write(createjob)
            open(`./sqoopjob/partition-bin/` + job[`job_name`].lower() + `.sh`, `w`).write(shell_cmd+createjob)
            open(`./sqoopjob/exec_run.sh`, `a`).write(shell_cmd+createjob)
            crontabf.write(```30 02 * * 6 cd /root/hive_import/bin&& ./{job_name}.sh >>../logs/{job_name}.out 2>&1
```.format(
                    job_name=job[`job_name`].lower()))
sjf.close()
hcf.close()
imcf.close()
df.close()
#cf.close()
print(`指令碼生成結束,詳見./sqoopjob/*`)

if __name__==`__main__`:

#生成json檔案
json_make(input_file=`./tablelist`)
#生成sqoop指令碼
create_job(tablelist=`tablelist.json`)

下面是生成hbase任務的指令碼

!/usr/bin/python3

coding=utf-8

import json,os
def json_make(input_file=`./hbase_tablelist`):

#input_file =`./sqoopjob/tablelist`
lines = open(input_file, "r",encoding="utf_8_sig").readlines()
[lines.remove(i) for i in lines if i in [``, `
`]]
lines = [line.strip() for line in lines]

# 獲取鍵值
keys = lines[0].split(`	`)
line_num = 1
total_lines = len(lines)
parsed_datas = []
while line_num < total_lines:
        values = lines[line_num].split("	")
        parsed_datas.append(dict(zip(keys, values)))
        line_num = line_num + 1
json_str = json.dumps(parsed_datas, ensure_ascii=False, indent=4)
output_file = input_file+`.json`

# write to the file
f = open(output_file, "w", encoding="utf-8")
f.write(json_str)
f.close()
print(`json格式轉換結束！詳見%s`%(output_file))

def create_job(tablelist):

if os.path.exists(`sqoopjob`):
    os.system(`rm -fr sqoopjob/*`)
    os.system(`mkdir  sqoopjob/hbase-bin`)
else:
    os.mkdir(`sqoopjob`)
sqoopmeta=`jdbc:hsqldb:hsql://localhost:16000/sqoop`
jdbc=`jdbc:oracle:thin:@10.90.87.35:11521:bdccdb2 --username sqoopuser --password Bigdata_2016`
sjf=open(`sqoopjob/createjob.sh`, "w")
crontabf=open(`./sqoopjob/crontab.cron`, `w`)
df=open(`./sqoopjob/deletejob.sh`, `w`)
kerboros=`kinit -kt /keytab/sqoopdba.keytab sqoopdba 
`

with open(tablelist, `r`) as load_f:
    load_dict = json.load(load_f)
    for job in load_dict:
        if job[`table_type`].lower()==`dim` and job[`partition`]==`0`:
            #處理檔案表
            createjob = ```sqoop  job --create {job_name} --meta-connect {sqoopmeta} \
                    -- import --connect {jdbc} \
                    --table {source_table} \
                    --incremental append \
                    --split-by {split_by} \
                    --hbase-create-table \
                    --hbase-table {hive_table} \
                    --check-column  {check_column} \
                    --last-value `2011-01-01 11:00:00` \
                    --hbase-row-key {row_key} \
                    --column-family cf \
                    -m 2;
```.format(
                    job_name=job[`job_name`].lower(),
                    sqoopmeta=sqoopmeta,
                    jdbc=jdbc,
                    source_table=job[`source_table`].upper(),
                    split_by=job[`split_by`].upper(),
                    hive_table=job[`hive_table`].upper(),
                    check_column=job[`datatime_cloumn`].upper(),
                    row_key=job[`row_key`]
                    ).replace(`    `,``)

            execjob = ```sqoop  job --meta-connect jdbc:hsqldb:hsql://localhost:16000/sqoop 
                    --exec {job_name};
```.format(job_name=job[`job_name`].lower()).replace(`    `,``)

            deledrop = ```sqoop  job --meta-connect jdbc:hsqldb:hsql://localhost:16000/sqoop 
                    --delete {job_name};
```.format(job_name=job[`job_name`].lower() ).replace(`    `,``)

            createtable=``` CREATE EXTERNAL TABLE {hive_table}({columns})

STORED BY `org.apache.hadoop.hive.hbase.HBaseStorageHandler`
WITH SERDEPROPERTIES (“hbase.columns.mapping” = “:key,cf:LAST_ANALYZED,cf:SAMPLE_SIZE,cf:CHARACTER_SET_NAME”)
TBLPROPERTIES(“hbase.table.name” = “{hive_table}”, “hbase.mapred.output.outputtable” = “{hive_table}”);
“`.format(hive_table=job[`hive_table`],

       columns=job[`colums`].split(`,`).join())
            #print(sjf)
            sjf.write(createjob)

            df.write(deledrop)
            open(`./sqoopjob/hbase-bin/` + job[`job_name`].lower() + `.sh`, `w`).write(execjob)
            crontabf.write(```30 02 * * 6 cd /root/hive_import/bin&& ./{job_name}_hql.sh >>../logs/{job_name}_hql.out 2>&1
```.format(
                job_name=job[`job_name`].lower()))
            execjob = ```sqoop  job --meta-connect jdbc:hsqldb:hsql://localhost:16000/sqoop 
                    --exec {job_name};
```.format(job_name=job[`job_name`].lower()).replace(`    `,``)
            open(`./sqoopjob/exec_run.sh`, `a`).write(execjob)
        else :pass

sjf.close()
df.close()
#cf.close()
print(`指令碼生成結束,詳見./sqoopjob/*`)

if __name__==`__main__`:

#生成json檔案
json_make(input_file=`./hbase_tablelist`)
#生成sqoop指令碼
create_job(tablelist=`./hbase_tablelist.json`)

hbase任務

!/usr/bin/python3

coding=utf-8

import json,os
def json_make(input_file=`./hbase_tablelist`):

#input_file =`./sqoopjob/tablelist`
lines = open(input_file, "r",encoding="utf_8_sig").readlines()
[lines.remove(i) for i in lines if i in [``, `
`]]
lines = [line.strip() for line in lines]

# 獲取鍵值
keys = lines[0].split(`	`)
line_num = 1
total_lines = len(lines)
parsed_datas = []
while line_num < total_lines:
        values = lines[line_num].split("	")
        parsed_datas.append(dict(zip(keys, values)))
        line_num = line_num + 1
json_str = json.dumps(parsed_datas, ensure_ascii=False, indent=4)
output_file = input_file+`.json`

# write to the file
f = open(output_file, "w", encoding="utf-8")
f.write(json_str)
f.close()
print(`json格式轉換結束！詳見%s`%(output_file))

def create_job(tablelist):

if os.path.exists(`sqoopjob`):
    os.system(`rm -fr sqoopjob/*`)
    os.system(`mkdir  sqoopjob/hbase-bin`)
else:
    os.mkdir(`sqoopjob`)
sqoopmeta=`jdbc:hsqldb:hsql://localhost:16000/sqoop`
jdbc=`jdbc:oracle:thin:@10.90.87.35:11521:bdccdb2 --username sqoopuser --password Bigdata_2016`
sjf=open(`sqoopjob/createjob.sh`, "w")
crontabf=open(`./sqoopjob/crontab.cron`, `w`)
df=open(`./sqoopjob/deletejob.sh`, `w`)
createtablef=open(`./sqoopjob/createtable.sh`, `w`)
kerboros=`kinit -kt /keytab/sqoopdba.keytab sqoopdba 
`

with open(tablelist, `r`) as load_f:
    load_dict = json.load(load_f)
    for job in load_dict:
        if job[`table_type`].lower()==`dim` and job[`partition`]==`0`:
            #處理檔案表
            createjob = ```sqoop  job --create {job_name} --meta-connect {sqoopmeta} \
                    -- import --connect {jdbc} \
                    --table {source_table} \
                    --incremental append \
                    --split-by {split_by} \
                    --hbase-create-table \
                    --hbase-table {hive_table} \
                    --check-column  {check_column} \
                    --last-value `2011-01-01 11:00:00` \
                    --hbase-row-key {row_key} \
                    --column-family cf \
                    -m 2;
```.format(
                    job_name=job[`job_name`].lower(),
                    sqoopmeta=sqoopmeta,
                    jdbc=jdbc,
                    source_table=job[`source_table`].upper(),
                    split_by=job[`split_by`].upper(),
                    hive_table=job[`hive_table`].upper(),
                    check_column=job[`datatime_cloumn`].upper(),
                    row_key=job[`row_key`]
                    ).replace(`    `,``)

            execjob = ```sqoop  job --meta-connect jdbc:hsqldb:hsql://localhost:16000/sqoop 
                    --exec {job_name};
```.format(job_name=job[`job_name`].lower()).replace(`    `,``)

            deledrop = ```sqoop  job --meta-connect jdbc:hsqldb:hsql://localhost:16000/sqoop 
                    --delete {job_name};
```.format(job_name=job[`job_name`].lower() ).replace(`    `,``)

            createtable=```hive -e "use{hive_db};CREATE EXTERNAL TABLE {hive_table}_external(key string,{columns_hive})
                        STORED BY `org.apache.hadoop.hive.hbase.HBaseStorageHandler`
                        WITH SERDEPROPERTIES (`hbase.columns.mapping` = `{columns_hbase}`)
                        TBLPROPERTIES(`hbase.table.name` = `{hive_table}`,
                        `hbase.mapred.output.outputtable` = `{hive_table}`)";
 ```.format(
                                    hive_table=job[`hive_table`],
                                    hive_db=job[`hive_db`],
                                    columns_hive=` string,`.join(job[`columns`].split(`,`))+` string`,
                                    columns_hbase=`:key,cf:`+`,cf:`.join(job[`columns`].split(`,`))
                                    ).replace(`    `,``)
            sjf.write(createjob)
            createtablef.write(createtable)
            df.write(deledrop)
            open(`./sqoopjob/hbase-bin/` + job[`job_name`].lower() + `.sh`, `w`).write(execjob)
            crontabf.write(```30 02 * * 6 cd /root/hive_import/bin&& ./{job_name}_hql.sh >>../logs/{job_name}_hql.out 2>&1
```.format(
                job_name=job[`job_name`].lower()))
            execjob = ```sqoop  job --meta-connect jdbc:hsqldb:hsql://localhost:16000/sqoop 
                    --exec {job_name};
```.format(job_name=job[`job_name`].lower()).replace(`    `,``)
            open(`./sqoopjob/exec_run.sh`, `a`).write(execjob)
        else :pass

sjf.close()
df.close()
#cf.close()
print(`指令碼生成結束,詳見./sqoopjob/*`)

if __name__==`__main__`:

#生成json檔案
json_make(input_file=`./hbase_tablelist`)
#生成sqoop指令碼
create_job(tablelist=`./hbase_tablelist.json`)

【AWR】Oracle批量生成awr報告指令碼
2021-10-12
Oracle指令碼
hadoop_批量命令指令碼&同步檔案指令碼
2018-09-15
Hadoop指令碼
redolog生成指令碼
2021-03-04
指令碼
批量修改檔名的bash指令碼
2019-02-15
指令碼
批量修改OC類名指令碼 -- python
2018-12-21
指令碼Python
命令列批量截圖Node指令碼
2019-01-25
命令列指令碼
ExcelWeb指令碼助手，自定義指令碼，批量操作Excel與網頁
2020-08-14
ExcelWeb指令碼網頁
iOS使用shell指令碼批量修改屬性
2019-04-04
iOS指令碼
Elasticsearch批量匯入資料指令碼（python）
2018-08-11
Elasticsearch指令碼Python
iOS使用Shell指令碼批量修改類名稱
2019-04-04
iOS指令碼
如何用 Python 指令碼批量下載 Google 影象？
2018-07-13
Python指令碼Go
通過shell指令碼批量新增使用者
2019-12-09
指令碼
MySQL 批量更新、刪除資料shell指令碼
2019-12-26
MySql指令碼
[20190107]生成bbed執行指令碼:
2019-01-07
指令碼
通過shell指令碼批量操作mysql資料庫
2019-07-14
指令碼MySql資料庫
案例四：Shell指令碼生成隨機密碼
2019-07-12
指令碼隨機密碼
IDEA 利用groovy指令碼生成註釋
2024-10-31
Idea指令碼
Oracle批次生成Merge指令碼程式
2021-09-07
Oracle指令碼
Linux下批量ping某個網段ip的指令碼
2018-05-22
Linux指令碼
MySQL批量轉換表名為小寫(Python指令碼)
2018-03-23
MySqlPython指令碼
Jmeter 本身能錄製指令碼，為什麼還要用 Fiddler 生成指令碼？
2020-07-03
JMeter指令碼
mssql生成資料庫字典指令碼-MarkDown
2024-04-08
SQL資料庫指令碼
[20231021]生成bbed的執行指令碼.txt
2023-10-23
指令碼
awr報告每天自動生成指令碼
2019-08-21
指令碼
SQL Server映象自動生成指令碼方法
2021-09-09
SQLServer指令碼
批量生成100萬張小程式碼？瞭解一下。
2018-11-19
swift指令碼程式設計：一鍵生成AppIcon
2019-02-28
Swift指令碼程式設計APP
PowerDesigner: 利用sql指令碼檔案逆生成模型
2024-11-11
SQL指令碼模型
第22篇生成proto檔案bat指令碼
2024-09-13
BAT指令碼
iOS使用指令碼跟隨工程程式碼動態生成Framework
2019-04-09
iOS指令碼Framework
手寫指令碼程式碼太累！搞一個生成工具吧
2020-07-31
指令碼
[20231023]生成bbed的執行指令碼(bash shell).txt
2023-11-05
指令碼
用bat指令碼自動生成安裝包Innosetup
2020-09-27
BAT指令碼
一個能夠生成 Markdown 表格的 Bash 指令碼
2024-08-22
指令碼
LightDB/PostgreSQL 生成可重複執行的指令碼
2022-05-26
SQL指令碼
Sqoop job
2020-09-30
OOP
NFT 製作生成簡單入門——批量道具藏品生成
2022-05-05
python批量ppt轉圖片，pdf轉圖片，word轉圖片指令碼
2021-11-29
Python指令碼

sqoop指令碼批量生成

hive任務

!/usr/bin/python3

coding=utf-8

下面是生成hbase任務的指令碼

!/usr/bin/python3

coding=utf-8

hbase任務

!/usr/bin/python3

coding=utf-8

相關文章