海量資料遷移之使用shell啟用多個動態並行
如果啟用了多個並行的程式,可能會有資源分配上的問題。
比如下面有10個表,100代表預計的時間為100分鐘。
table1 100
table2 90
table3 90
table4 80
table5 80
table6 70
table7 60
table8 60
table9 50
table10 40
如果分為4個程式來並行執行,可能一種比較理想的方案就是
parallel1: table1,table8
parallel2: table2,table5,table9
parallel3: table3,table6,table9
parallel4: table4,table7
但是在實際的執行中,可能因為表的分割槽,表的資料型別,表的儲存的不同,可能實際的執行時間會有很大的差別,
可能paralle2,3,4已經執行完了,而parallel1還沒有執行完50%。
這樣,table8就一直pending在那了。
在這樣的情況下,可以考慮使用動態並行,就是能夠在後臺啟用一些並行的程式,比如需要4個並行程式,就使用nohup啟用4個並行的程式。
不做具體的資料操作。
parfile=par2_tab_parall.lst
logfile=`echo $parfile|awk -F. '{print $1}`".log"
while true
do
if [ -f $parfile ]
then
tab_exists_flag=`cat $parfile |wc -l`
if [ ${tab_exists_flag} -eq 0 ]
then
sleep 5;
elif [ ${tab_exists_flag} -gt 0 ]
then
tab_name=`cat $parfile`
ksh appendata.sh $tab_name >> $logfile
touch ${parfile}.tmp
mv ${parfile}.tmp ${parfile}
fi
fi
done
我們使用appendata.sh來模擬實現資料的插入,其實不會做資料的真實插入,這是模擬日誌的內容。
echo $1
sqlplus -s n1/n1 <
set timin on
set pages 0
select 'insert into '||'$1;' from dual;
select 'commit;' from dual;
EOF
if [ $? -eq 0 ]
then
echo '' >parallel1.lst
fi
使用如下的命令來啟用一個程式,比如下面的命令啟用程式2,如果啟用其他的程式,命令類似
nohup ksh par2.sh > par2_tab_parall.log &
只需要在一個檔案中放入處理的表名即可。如果是程式2,就在par2_tab_parall.lst中放入表名,假設表為test
par2_tab_parall.lst
[ora11g@rac1 parallel]$ cat par2_tab_parall.lst
test
如果放入表test,之後,就會發現第2個程式就開始處理表test了
test
insert into test;
Elapsed: 00:00:00.00
commit;
Elapsed: 00:00:00.01
再放入一個表,馬上就會發現程式開始處理表tab_test了,如果沒有表的時候,它就在後臺做sleep工作。
[ora11g@rac1 parallel]$ echo tab_test > par2_tab_parall.lst
tab_test
insert into tab_test;
Elapsed: 00:00:00.01
commit;
Elapsed: 00:00:00.00
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/8494287/viewspace-1347042/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 海量資料遷移之使用分割槽並行切分匯入並行
- 海量資料遷移之透過shell估算資料量
- 海量資料遷移之通過shell估算資料量
- 海量資料遷移之分割槽並行抽取並行
- 海量資料遷移之分割槽並行切分並行
- 海量資料遷移之外部表並行抽取並行
- 海量資料遷移之資料抽取流程
- 海量資料處理_使用外部表進行資料遷移
- 海量資料遷移之資料載入流程
- 海量資料遷移之衝突資料篩查
- 使用impdp,expdp資料泵進入海量資料遷移
- 海量資料遷移之傳輸表空間(一)
- 海量資料儲存之動態SchemaOU
- 海量資料遷移之sqlldr和datapump的缺點分析SQL
- 海量資料遷移之誤操作和防範建議
- 海量資料遷移之透過rowid切分大表
- 海量資料遷移之通過rowid切分大表
- 海量資料遷移之外部表切分
- 海量資料轉換遷移的程式碼自動生成
- 海量資料處理_資料泵分批資料遷移
- EF 中多個資料庫遷移資料庫
- 海量資料遷移之外部表載入
- 使用RMAN進行資料遷移
- 使用dbeaver 用csv 檔案進行資料遷移
- 海量資料遷移之一個誤操作的問題總結
- KVM線上遷移(動態遷移)
- 【遷移】使用rman遷移資料庫資料庫
- 動態SQL完成大表資料的遷移SQL
- 用python進行資料庫資料遷移Python資料庫
- 使用shell批量生成資料整合式遷移的指令碼指令碼
- 如何使用 abp 建立 module 並應用單獨的資料庫遷移資料庫
- 使用RMAN進行Oracle資料庫遷移Oracle資料庫
- 使用RMAN執行oracle ASM資料遷移OracleASM
- 【資料遷移】使用傳輸表空間遷移資料
- 誇平臺多個schame資料遷移(exp,imp)
- 運維效率之資料遷移自動化運維
- 用rman遷移資料庫資料庫
- 今天晚上進行資料遷移