【必學】Linux 下三劍客的技能,你敢不學?
本文字數:2355字
閱讀本文大概需要:6 分鐘
awk是一種用於處理文字、模式匹配的程式語言。與sed和grep,俗稱Linux下的三劍客。學會 awk 等於你在 Linux 命令列裡,又多了一種處理文字的選擇。這篇文章重點教你如何使用,看完這篇文章,就大致知道如何使用了,力求簡單使用。
術語鋪墊
在awk的文字處理規則裡,awk將文字檔案視為由欄位和記錄組成的文字資料庫。預設情況下,awk將每一行視為一個記錄,也就是說記錄的分隔符是\n,記錄的分隔符可以透過內建變數RS更改。
在每一個記錄中,又把記錄分為若干個欄位,即記錄由欄位組成,而欄位的預設分隔符為空格或製表符。
一、基礎用法
和我們平常使用的 Linux 命令一樣, awk 也是遵循著某種格式來使用,格式如下:
# 使用格式
awk 執行的事件 檔案
# 例如:
[root@iamshuaidi ~]# awk '{print $0}' test.txt
my first language:Java
second languange:python
third language:C
注:可以左右拉動
其中,print 表示列印,$0 表示一整個記錄,test.txt 表示一個檔案。所以
awk '{print $0}' test.txt
表示把 test.txt 檔案裡面的每行記錄都列印出來。
剛才我們說,記錄是由欄位組成的,且欄位的預設分隔符是空格或者製表符。下面我們列印每一個記錄的第一個欄位,如下:
# 列印每一行的第一個欄位
[root@iamshuaidi # awk '{print $1}' test.txt
my
second
third
$0 表示整個記錄,不過 $1, $2, $3.....則表示整個記錄中的第一個欄位,第二個欄位......。
剛才我們說欄位的預設分隔符是空格或者製表符這些,預設意味著我們可以自己顯式著指定分隔符。下面我們用“:”來作為我們的分隔符吧。
# 列印第二個欄位
[root@iamshuaidi ~]# awk -F ':' '{print $2}' test.txt
Java
python
C
上面我們用引數 -F 指定了我們的分隔符,即如果想要指定欄位的分隔符,可以用引數 -F 指定分隔符。
二、條件限制
在列印文字的時候,我們可以指定一些條件。格式如下:
awk 引數 條件 要執行的動作 檔案
例如我們指定分隔符為“:”,條件為第二個欄位為"Java"的記錄。
# 列印第二個欄位為"Java"的文字
[root@iamshuaidi ~]# awk -F ':''$2 == "Java" {print $2}' test.txt
Java
列印奇數行的的第二個欄位:
# 列印奇數行的記錄
[root@iamshuaidi ~]# awk -F ':' 'NR % 2 == 1 {print $2}' test.txt
Java
C
其中,NR 是一個內建的變數,表示當前正在處理的記錄,即當前的記錄是第幾個記錄。
三、條件語句
和我們平常的程式設計一樣,awk 也提供了 if, else, while 等這些條件語句。
例如,列印第二個及其之後的記錄:
root@iamshuaidi ~]# awk '{if(NR > 1) print $2}' test.txt
languange:python
language:C
注意,上面的欄位分隔符是空格了,並且 if 語句是在“{}” 裡指定的。
再看一個例子:
# 如果第一個欄位大於“s",則列印第一個欄位,否則列印第二個欄位
[root@iamshuaidi ~]# awk '{if($1 < "s") print $1; else print $2}' test.txt
my
languange:python
language:C
注:可以左右拉動
上面列印的是:如果第一個欄位大於“s",則列印第一個欄位,否則列印第二個欄位。
四、函式
awk 提供了一些內建函式來供我們使用,一下常用的函式如下:
tolower():字元轉為小寫。
toupper():字元轉為大寫
length():返回字串長度。
substr():返回子字串。
sqrt():平方根。
rand():隨機數。
例如,我們要把列印的欄位轉化為大小
# 第一個欄位轉化為大寫輸出
[root@iamshuaidi ~]# awk '{print toupper($1)}' test.txt
MY
SECOND
THIRD
五、變數
剛才我們說 NR 是一個表示當前正在處理的記錄是第幾個記錄的內建變數,常用的內建變數如下:
NR:表示當前處理的是第幾行
NF:表示當前行有多少個欄位
FILENAME:當前檔名
FS:欄位分隔符,預設是空格和製表符。
RS:行分隔符,用於分割每一行,預設是換行符。
OFS:輸出欄位的分隔符,用於列印時分隔欄位,預設為空格。
ORS:輸出記錄的分隔符,用於列印時分隔記錄,預設為換行符。
例如我們要列印每一個記錄的最後一個欄位,就可以使用變數 NF 了。
[root@iamshuaidi ~]# awk '{print $NF}' test.txt
language:Java
languange:python
language:C
對了,剛才那個 NR 的變數也是挺好用的,例如:
# 標記當前是第幾行,這樣看起來好像比較舒服?
[root@iamshuaidi ~]# awk '{print NR ". " $0}' test.txt
1. my first language:Java
2. second languange:python
3. third language:C
講到這裡就大致結束了,這篇文章算是入門文章,遮蔽了很多細節,大致介紹一下怎麼使用,更多具體用法,可以根據自己想要實現的功能去查詢相關函式哦。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561266/viewspace-2222094/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 一篇文章帶你學會Linux三劍客之一:awkLinux
- Linux文字三劍客Linux
- Linux 三劍客之sedLinux
- Linux三劍客之sedLinux
- Linux文字三劍客總結Linux
- Linux三大劍客之awkLinux
- Linux三劍客之awk詳解Linux
- Linux三劍客之grep詳解Linux
- Linux三劍客grep、awk和sedLinux
- 使用linux三劍客取ip地址Linux
- Linux (三劍客之三) awk命令詳解Linux
- Android開發者必備的技能你會嗎?MVVM 最新學習心得!AndroidMVVM
- 006 Linux 命令三劍客之-grepLinux
- Linux 三劍客之 grep 使用詳解Linux
- linux三劍客(grep、sed、awk)基本使用Linux
- 007 Linux 命令三劍客之-awkLinux
- Linux三劍客之awk入門指引Linux
- Linux系統命令三劍客之 awkLinux
- JavaScript字串“三劍客”JavaScript字串
- 三劍客詳解
- Linux三劍客Awk、Sed、Grep 命令詳解Linux
- Linux 三劍客 Awk、Sed、Grep 命令詳解Linux
- 【案例】Linux三劍客中awk命令如何使用?Linux
- Linux檔案處理三劍客之sedLinux
- Linux檔案處理三劍客之grepLinux
- Linux檔案處理三劍客之awkLinux
- 紅客必學:Windows下的許可權設定詳解Windows
- 前端三劍客之HTML前端HTML
- 四劍客第三關
- Linux 三劍客之 awk 實戰詳解教程Linux
- 想學Web前端,你需要了解這些職責和必備技能Web前端
- 掌握Linux技能的學習方法有什麼?Linux學習Linux
- Linux新手大禮包:學習Linux你必須知道的那些事兒Linux
- LNMP組合工作流程是什麼?linux運維必學技能LNMPLinux運維
- 學習Linux技術能獲的什麼技能?Linux學習Linux
- CSS陰影效果三劍客CSS
- JRuby GUI API三劍客GUIAPI
- 三劍客詳解之find