1、AWK的條件表達
如下圖所示:
2、條件表示式說明
以下練習使用如下文字:
ID Name Python Linux MySQL Java
1 Tangs 88 87 86 85.55
2 Sunwk 99 98 97 96,66
3 Zhubj 77 76 75 74.44
4 Shahs 66 65 64 63.33
(1)BEGIN
BEGIN
是AWK的保留字,是一種特殊的條件型別。
BEGIN
的執行時機是在AWK程式一開始時,尚未讀取任何資料之前執行。
BEGIN
後的動作只執行一次,因為當AWK開始從檔案中讀入資料,BEGIN
的條件就不再成立,所以BEGIN
定義的動作只能被執行一次。
練習:執行命令檢視BEGIN
作用:
執行命令:awk 'BEGIN{print "This is BEGIN action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
[root@localhost tmp]# awk 'BEGIN{print "This is BEGIN action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
This is BEGIN action
Name Python Java
Tangs 88 85.55
Sunwk 99 96.66
Zhubj 77 74.44
Shahs 66 63.33
說明:
- AWK命令只要檢測不到完整的單引號不會執行,所以這個命令的換行不用加入
\
,就是一行命令- 上邊命令定義了兩個動作:
第一個動作使用BEGIN
條件,所以會在讀入檔案資料前列印“This is BEGIN action”(只會執行一次)
第二個動作會列印檔案中的對應文字。
(2)END
END
也是AWK保留字,不過剛好和BEGIN
相反。
END
是在AWK程式處理完所有資料,即將結束時執行。END
後的動作只在程式結束時執行一次。
練習:執行命令檢視END
作用:
執行命令:awk 'END{print "This is END action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
[root@localhost tmp]# awk 'END{print "This is END action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
Name Python Java
Tangs 88 85.55
Sunwk 99 96.66
Zhubj 77 74.44
Shahs 66 63.33
This is END action
說明:在輸出結尾輸入“This is END action”,這並不是文件本身的內容,而且只會執行一次。
(3)關係運算子
假設我想看看Java績大於等於80分的學員是誰,就可以這樣輸入命令:
grep -v "Name" student.txt | awk '$6>=80 {printf $2 "\n"}'
# 判斷第六欄位(Java成績)大於等於80分的行,如果判斷式成立,則列印第2列(學員名)
[root@localhost tmp]# grep -v "Name" student.txt | awk '$6>=80 {printf $2 "\n"}'
Tangs
Sunwk
grep -v "Name" student.txt
是把標題過濾掉。
(4)說明AWK中條件表示式的執行過程
要先說明一下,雖然AWK是列提取命令,但是也要按行來讀入的。
在AWK處理一個文字檔案的時候:
- 先判斷表示式中有沒有
BEGIN
。
如果有,就先執行BEGIN
定義的操作,且執行一次。 - 如果沒有
BEGIN
或者BEGIN
定義的動作執行完成之後,會把文字中的第一行資料讀入AWK中,
把該行的整行資料賦予$0
變數中,
把該行資料的第一列賦值在$1
變數中,第二列賦值在$2
變數中,以此類推。 - 例如
awk '{printf $2 "\n"}' student.txt
,意思是列印文字中的第二列姓名。
我們先忽略掉條件,流程是:
AWK讀取第一行資料(上面一步),然後執行動作輸出第二列資訊,也就是輸出第一行的第二列資訊。
然後開始讀取第二行資料,然後再執行動作,輸出第二行的第二列資訊,
然後再讀取第三行資料,之後執行動作,輸出第三行的第二列資訊,
以此類推,基本上就是這樣的一個過程。 - 然後在加上條件
awk '$6>=80 {printf $2 "\n"}' student.txt
判斷第六列Java的成績大於80分,才輸出。
還是和上邊一樣,先是AWK讀取第一行資料完成之後,就要處理動作了,
但是在處理動作之前,先要判斷一下動作前面的條件是否成立,
如果成立,則執行後邊的動作。
如果不成立,則不執行跟在後邊的動作。
然後在開始讀取第二行資料,重複上邊的流程,以此類推。
總結一下就是:加入了條件之後,只有條件成立動作才會執行,如果條件不滿足,則動作則不執行。 - 最後如果有
END
,則把END
中定義的動作執行一次。
以上就是AWK的執行流程。
(5)AWK中使用正規表示式
如果要想讓AWK識別字串,必須使用//
包含,//
中識別的就是正規表示式規則匹配的字串。
例如:
# 輸出列印Sunwk的成績
# awk會匹配有Sunwk符號的行,並輸出
[root@localhost tmp]# awk '/Sunwk/ {print}' student.txt
2 Sunwk 99 98 97 96.66
注意:這裡要注意在AWK中,使用
//
包含的字串,AWK命令才會查詢。也就是說字串必須用//
包含,AWK命令才能正確識別。
(6)A~B
練習
A~B
是A包含B的意思。
練習:檢視Sunwk
使用者的Java成績。
# 匹配第二欄位中包含有“Sun”字元,則列印第六欄位資料
[root@localhost tmp]# awk '$2 ~ /Sun/ {printf $6 "\n" }' student.txt
96.66
提示:(6)練習的方式,是在某一列中查詢是否包含一個字串。而上面(5)的寫法,是在一行資料當中匹配是否包含一個字串,根據需求靈活使用。
注意:
~
兩邊有無空格都可以。
擴充練習:
當使用df
命令檢視分割槽使用情況時,如果我只想檢視真正的系統分割槽的使用狀況,而不想檢視光碟和臨時分割槽的使用狀況,則可以執行如下:
# 查詢包含有sda+數字的行,並列印第一欄位和第五欄位
[root@localhost tmp]# df -h | awk '/sda[0-9]/ {printf $1 "\t" $5 "\t" "\n"}'
/dev/sda3 12%
/dev/sda1 15%