用shell指令碼合併多個檔案內容
需求描述
現有多個具有相同命名格式及內容格式的檔案,要求編寫shell指令碼將它們合併到一個檔案中。
被合併檔案的命名格式為:YYYYMMDDHHMISS.r,例如:20161018030205.r;檔案中包含了若干行記錄,每行記錄包含26個字元,其中第一個字元為標識位,第7到12個字元為時間(格式:YYMMDD),例如:000000161019002925000003N0,該記錄的第一個字元0為標識位,第7到12個字元161019表示時間,即16年的10月19日;合併之後的檔案的命名格式為:YYYYMMDD.txt,例如:20161018.txt。
對於合併操作,具體要求為:
1)當天只合並前一天的檔案,如今天(10月20日)只合並昨天(10月19日)的檔案,檔案時間通過檔案命名即可看出。
2)標識位為0的記錄會被寫到合併之後的檔案中,其他記錄將被過濾掉。
3)時間(即第7到12個字元的值)為前一天的記錄會被寫到合併之後的檔案中,其他記錄將被過濾掉。
shell指令碼
#!/bin/bash
srcparh=/home/zhou/src
exportpath=/home/zhou/export
linenum=0
return_fail()
{
exit 1
}
function check_config_dir
{
if [ ! -d ${srcparh} ];then
echo "[error]:${srcparh} has not existed!!"
return_fail
fi
if [ ! -d ${exportpath}]; then
echo "[error]:${exportpath} has not existed!!"
return_fail
fi
}
function merge_file
{
##YESTERDAY DATE YYMMDD
YES_DATE_YY=`date -dyesterday +%y%m%d`
##YESTERDAY filename
YES_FILENAME=`date -dyesterday +%Y%m%d`.txt
ONE_DAY_AGO=`date -dyesterday +%y%m%d`
echo"YESTERDAY:${ONE_DAY_AGO}"
echo "`date+%Y-%m-%d` `date +%T`----begin to merge file"
if [ -s ${YES_FILENAME}]; then
echo "warn:yesterday file ${YES_FILENAME} has existed!! now backup it to${YES_FILENAME}_bak."
mv ${YES_FILENAME}${YES_FILENAME}_bak
fi
cd ${srcparh}
file_list_temp=`ls | grep-E "${ONE_DAY_AGO}"`
file_list_count=`ls |grep -E "${ONE_DAY_AGO}" | wc -l`
echo " "
echo "there are${file_list_count} yesterday file(s) to be merged."
echo " "
>${exportpath}/${YES_FILENAME}
for file_name in$file_list_temp
do
echo "now to merge ${file_name}"
cat ${file_name} | grep "^0" >${file_name}_filter_firstline
while read line
do
echo ""
echo "nowto deal this line: ${line}"
echo ""
start_data=+${line:6:6}+
echo"${start_data}" | grep "+${ONE_DAY_AGO}+"
if [ $? -eq 0 ]
then
echo"${line}" >> ${exportpath}/${YES_FILENAME}
linenum=$[linenum+1]
fi
done <${file_name}_filter_firstline
rm*_filter_firstline
done
if [ ${linenum} -gt 0 ]
then
echo "Totally ${linenum} lines havemerged."
fi
if [ ! -s${exportpath}/${YES_FILENAME} ]
then
echo "warn:there is no yesterday file record!!,${exportpath}/${YES_FILENAME} isblank!"
echo " ">${exportpath}/${YES_FILENAME}
fi
}
main()
{
echo " "
echo "this mergetool begins running --------------------"
check_config_dir;
merge_file;
echo"-------------end ---------------------"
}
## Execute main function
main $*
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
指令碼說明
第一,在指令碼的第3到5行,定義了三個變數,其中srcparh用於存放被合併的檔案,exportpath用於存放合併之後的檔案,linenum用於表示本次寫到合併之後的檔案中的記錄的條數。
第二,return_fail用於在執行出現異常(如srcparh或exportpath所表示的路徑不存在)時退出程式而不進行後續處理。
第三,check_config_dir函式用於檢查srcparh或exportpath所表示的路徑是否存在,如不存在,則不進行後續處理。
第四,merge_file函式是本指令碼的核心,它的主要功能是找出srcparh下滿足時間條件的檔案,並按照需求要求將檔案中的記錄篩選出來,放到結果檔案中。如果有滿足條件的記錄,那麼指令碼會顯示寫入到結果檔案中的記錄的條數。
第五,main函式是整個程式的入口(就像C語言中的main函式一樣),它呼叫了check_config_dir和merge_file函式。
指令碼執行結果
第一,當srcparh所表示的路徑不存在時,執行結果如下:
> ./file_merge_tool.sh
this merge tool begins running --------------------
[error]: /home/zhou/src has not existed!!
- 1
- 2
- 3
- 4
第二,當exportpath所表示的路徑不存在時,執行結果如下:
> ./file_merge_tool.sh
this merge tool begins running --------------------
[error]: /home/zhou/export has not existed!!
- 1
- 2
- 3
- 4
第三,當srcparh所表示的路徑存在但不包含任何檔案時,執行結果如下:
> ./file_merge_tool.sh
this merge tool begins running --------------------
YESTERDAY:161019
2016-10-20 16:30:06----begin to merge file
there are 0 yesterday file(s) to be merged.
warn: there is no yesterday filerecord!!,/home/zhou/export/20161019.txt is blank!
-------------end ---------------------
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
第四,現有四個檔案20161018030205.r、20161019030254.r、20161019182531.r、20161019213456.r,每個檔案的內容如下:
20161018030205.r檔案:
000000161019002925000003N0
000000161019002931000003N0
300000161018002931000003N0
000000161019002926000009Y0
000000161019003150000003N0
20161019030254.r檔案:
000000161019004925000003N0
000000161019006931000003N0
100000161019006971000004N0
000000161019007926000009Y0
200000161019006871000004N0
000000161019008150000003N0
20161019182531.r檔案:
000000161019001925000003N0
000000161019004931000003N0
000000161018007926000009Y0
000000161019007926000009Y0
000000161019009150000003N0
000000161017007926000009Y0
600000161019007426000009Y0
20161019213456.r檔案:
000000161019002925000003N0
000000161019002931000003N0
000000161019002926000009Y0
800000161019002961000003N0
000000161019003150000003N0
將它們上傳到srcparh目錄下,執行指令碼,結果如下:
> ./file_merge_tool.sh
this merge tool begins running --------------------
YESTERDAY:161019
2016-10-20 17:08:24----begin to merge file
there are 3 yesterday file(s) to be merged.
now to merge 20161019030254.r
now to deal this line: 000000161019004925000003N0
+161019+
now to deal this line: 000000161019006931000003N0
+161019+
now to deal this line: 000000161019007926000009Y0
+161019+
now to deal this line: 000000161019008150000003N0
+161019+
now to merge 20161019182531.r
now to deal this line: 000000161019001925000003N0
+161019+
now to deal this line: 000000161019004931000003N0
+161019+
now to deal this line: 000000161018007926000009Y0
now to deal this line: 000000161019007926000009Y0
+161019+
now to deal this line: 000000161019009150000003N0
+161019+
now to deal this line: 000000161017007926000009Y0
now to merge 20161019213456.r
now to deal this line: 000000161019002925000003N0
+161019+
now to deal this line: 000000161019002931000003N0
+161019+
now to deal this line: 000000161019002926000009Y0
+161019+
now to deal this line: 000000161019003150000003N0
+161019+
Totally 12 lines have merged.
-------------end ---------------------
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
對照被合併的檔案和結果檔案,一共有4個檔案,但只有3個檔案(20161019030254.r、20161019182531.r、20161019213456.r)滿足時間條件,這3個檔案中滿足過濾條件(標識位為0、時間為前一天)的記錄條數為12條,和指令碼執行結果一致。
大家也可對本指令碼進行更多的測試。
總結
shell指令碼在基於Linux的開發中有極為廣泛的應用,因為它靠近底層,執行效率高、部署方便。本文中的指令碼也可以作為定時任務部署到機器上,讓它在每天的同一個時間裡自動執行。
當然,要想編寫出功能強大的shell指令碼,其前提條件是大家必須要對shell指令碼的語法非常的熟悉,這也可以看出基本功的重要性。
相關文章
- cat-合併輸出多個檔案的內容
- 【shell 指令碼】檢視*.gz 檔案的內容指令碼
- Shell指令碼匯入外部指令碼內容指令碼
- 多個excel檔案合併成一個excel表的方法 如何快速合併多個excel檔案Excel
- 多個 EXCEL 檔案如何合併成一個檔案Excel
- Python合併多個csv檔案Python
- iOS使用shell指令碼注入混淆內容iOS指令碼
- shell 檔案合併 去重 分割
- 共享一個iptables的shell指令碼檔案指令碼
- 【shell 】求兩個檔案相加的指令碼指令碼
- 用linux shell逐行讀取文字檔案內容Linux
- 多個excel檔案合併到一個檔案中的多個sheet表中Excel
- 辦公自動化:PDF檔案合併器,將多個PDF檔案進行合併
- Shell指令碼 | 抓取log檔案指令碼
- 用python寫一個指令碼:將指定目錄下及其所有子資料夾的所有的“srt”檔案的內容合併到一個新的srt檔案中Python指令碼
- iStylePDF把多個PDF合併成一個PDF檔案
- python合併多個csv檔案需要注意的問題(合併多個列名問題)Python
- 使用python遍歷一個目錄下所有的檔案併合並內容Python
- 用python寫一個指令碼,讀取srt檔案中的內容,並列印出重複的內容,且將不重複的內容儲存到新檔案中Python指令碼
- python合併多個csv檔案並去重Python
- Word 2007 合併多個檔案
- windows xp ultraiso工具合併多個iso檔案(一)WindowsAI
- grep、sed批量替換檔案內容shell
- Shell 命令求兩個檔案每行對比的相同內容
- 9個實用shell指令碼指令碼
- 如何使用python指令碼定時清空檔案內容?Python指令碼
- shell指令碼之批次清空檔案指令碼
- bash shell指令碼接受多個引數指令碼
- Python合併多個Excel檔案中的指定sheetPythonExcel
- properties檔案內容亂碼
- shell指令碼——比較兩個檔案大小、許可權指令碼
- java檔案相關(檔案追加內容、檔案內容清空、檔案內容讀取)Java
- 使用shell指令碼巧妙統計檔案指令碼
- 如何用Shell指令碼生成XML檔案指令碼XML
- shell指令碼技巧—建立和清空檔案指令碼
- Shell指令碼應用兩個例子指令碼
- [ Shell ] 通過 Shell 指令碼匯出 GDSII/OASIS 檔案指令碼
- shell 指令碼讀多個oracle_sid指令碼Oracle