awk -F '|' '{sub(/[0-9]+/,"",$2);print $0}' data.test
三。sub和gsub的區別

sub匹配第一次出現的符合模式的字串，相當於 sed 's//' 。
gsub匹配所有的符合模式的字串，相當於 sed 's//g' 。
例如：
awk '{sub(/Mac/,"Macintosh");print}' urfile 用Macintosh替換Mac
awk '{sub(/Mac/,"MacIntosh",$1); print}' file 第一個域內用Macintosh替換Mac
把上面sub換成gsub就表示在滿足條件得域裡面替換所有的字元。
awk的sub函式用法：
sub函式匹配指定域/記錄中最大、最靠左邊的子字串的正規表示式，並用替換字串替換這些字串。
如果沒有指定目標字串就預設使用整個記錄。替換隻發生在第一次匹配的時候。格式如下：
sub (regular expression, substitution string):
sub (regular expression, substitution string, target string)
例項：
$ awk '{ sub(/test/, "mytest"); print }' testfile
$ awk '{ sub(/test/, "mytest", $1); print }' testfile
第一個例子在整個記錄中匹配，替換隻發生在第一次匹配發生的時候。
第二個例子在整個記錄的第一個域中進行匹配，替換隻發生在第一次匹配發生的時候。
如要在整個檔案中進行匹配需要用到gsub
gsub函式作用如sub，但它在整個文件中進行匹配。格式如下：
gsub (regular expression, substitution string)
gsub (regular expression, substitution string, target string)
例項：
$ awk '{ gsub(/test/, "mytest"); print }' testfile
$ awk '{ gsub(/test/, "mytest", $1); print }' testfile
第一個例子在整個文件中匹配test，匹配的都被替換成mytest。
第二個例子在整個文件的第一個域中匹配，所有匹配的都被替換成mytest。
另外，只有當記錄中的域有改變的時候，指定0FS變數才有用，如果記錄中的域無變化，指定OFS產生不了實際效果。

awk -F'|' -v OFS='|' '{ gsub(/[0-9]/, "", $3); print $0; }' data.txt

將把第三個域中所有數字都去掉。

另外，對於數字的匹配，可以使用十六進位制。

awk -F'|' -v OFS='|' '{ gsub(/[/x30-/x39]/, "", $3); print $0; }' data.txt

刪除所有空白：（空格、TAB等）【注：三條語句等效】：
[oracle@localhost 201402261951.script]$ echo 'a bc d' | awk '{gsub(/[[:blank:]]/, "",$0)}'
abcd
[oracle@localhost 201402261951.script]$ echo 'a bc d' | awk 'gsub(/[[:blank:]]/, "",$0)'
abcd

【下面這條語句好像只輸出被處理完畢後的那些行，未沒被處理的行，不會輸出。上面的2條命令，不論是否被處理，每行都會被輸出，因為有print $0】
[oracle@localhost 201402261951.script]$ echo 'a bc d' | awk 'gsub(/[[:blank:]]/, "")'
abcd

awk sub和gsub區別及用法

相關文章