這節詳細介紹awk內建函式,主要分以下3種類似:算數函式、字串函式、其它一般函式、時間函式
一、算術函式:
以下算術函式執行與 C 語言中名稱相同的子例程相同的操作:
函式名 | 說明 |
atan2( y, x ) | 返回 y/x 的反正切。 |
cos( x ) | 返回 x 的餘弦;x 是弧度。 |
sin( x ) | 返回 x 的正弦;x 是弧度。 |
exp( x ) | 返回 x 冪函式。 |
log( x ) | 返回 x 的自然對數。 |
sqrt( x ) | 返回 x 平方根。 |
int( x ) | 返回 x 的截斷至整數的值。 |
rand( ) | 返回任意數字 n,其中 0 <= n < 1。 |
srand( [Expr] ) | 將 rand 函式的種子值設定為 Expr 引數的值,或如果省略 Expr 引數則使用某天的時間。返回先前的種子值。 |
舉例說明:
1 2 |
[chengmo@centos5 ~]$ awk 'BEGIN{OFMT="%.3f";fs=sin(1);fe=exp(10);fl=log(10);fi=int(3.1415);print fs,fe,fl,fi;}' 0.841 22026.466 2.303 3 |
OFMT 設定輸出資料格式是保留3位小數
獲得隨機數:
1 2 3 4 5 6 |
[chengmo@centos5 ~]$ awk 'BEGIN{srand();fr=int(100*rand());print fr;}' 78 [chengmo@centos5 ~]$ awk 'BEGIN{srand();fr=int(100*rand());print fr;}' 31 [chengmo@centos5 ~]$ awk 'BEGIN{srand();fr=int(100*rand());print fr;}' 41 |
二、字串函式是:
函式 | 說明 |
gsub( Ere, Repl, [ In ] ) | 除了正規表示式所有具體值被替代這點,它和 sub 函式完全一樣地執行,。 |
sub( Ere, Repl, [ In ] ) | 用 Repl 引數指定的字串替換 In 引數指定的字串中的由 Ere 引數指定的擴充套件正規表示式的第一個具體值。sub 函式返回替換的數量。出現在 Repl 引數指定的字串中的 &(和符號)由 In 引數指定的與 Ere 引數的指定的擴充套件正規表示式匹配的字串替換。如果未指定 In 引數,預設值是整個記錄($0 記錄變數)。 |
index( String1, String2 ) | 在由 String1 引數指定的字串(其中有出現 String2 指定的引數)中,返回位置,從 1 開始編號。如果 String2 引數不在 String1 引數中出現,則返回 0(零)。 |
length [(String)] | 返回 String 引數指定的字串的長度(字元形式)。如果未給出 String 引數,則返回整個記錄的長度($0 記錄變數)。 |
blength [(String)] | 返回 String 引數指定的字串的長度(以位元組為單位)。如果未給出 String 引數,則返回整個記錄的長度($0 記錄變數)。 |
substr( String, M, [ N ] ) | 返回具有 N 引數指定的字元數量子串。子串從 String 引數指定的字串取得,其字元以 M 引數指定的位置開始。M 引數指定為將 String 引數中的第一個字元作為編號 1。如果未指定 N 引數,則子串的長度將是 M 引數指定的位置到 String 引數的末尾 的長度。 |
match( String, Ere ) | 在 String 引數指定的字串(Ere 引數指定的擴充套件正規表示式出現在其中)中返回位置(字元形式),從 1 開始編號,或如果 Ere 引數不出現,則返回 0(零)。RSTART 特殊變數設定為返回值。RLENGTH 特殊變數設定為匹配的字串的長度,或如果未找到任何匹配,則設定為 -1(負一)。 |
split( String, A, [Ere] ) | 將 String 引數指定的引數分割為陣列元素 A[1], A[2], . . ., A[n],並返回 n 變數的值。此分隔可以通過 Ere 引數指定的擴充套件正規表示式進行,或用當前欄位分隔符(FS 特殊變數)來進行(如果沒有給出 Ere 引數)。除非上下文指明特定的元素還應具有一個數字值,否則 A 陣列中的元素用字串值來建立。 |
tolower( String ) | 返回 String 引數指定的字串,字串中每個大寫字元將更改為小寫。大寫和小寫的對映由當前語言環境的 LC_CTYPE 範疇定義。 |
toupper( String ) | 返回 String 引數指定的字串,字串中每個小寫字元將更改為大寫。大寫和小寫的對映由當前語言環境的 LC_CTYPE 範疇定義。 |
sprintf(Format, Expr, Expr, . . . ) | 根據 Format 引數指定的 printf 子例程格式字串來格式化 Expr 引數指定的表示式並返回最後生成的字串。 |
Ere都可以是正規表示式
gsub,sub使用
1 2 |
[chengmo@centos5 ~]$ awk 'BEGIN{info="this is a test2010test!";gsub(/[0-9]+/,"!",info);print info}' this is a test!test! |
在 info中查詢滿足正規表示式,/[0-9]+/ 用””替換,並且替換後的值,賦值給info 未給info值,預設是$0
查詢字串(index使用)
1 2 |
[wangsl@centos5 ~]$ awk 'BEGIN{info="this is a test2010test!";print index(info,"test")?"ok":"no found";}' ok |
未找到,返回0
正規表示式匹配查詢(match使用)
1 2 |
[wangsl@centos5 ~]$ awk 'BEGIN{info="this is a test2010test!";print match(info,/[0-9]+/)?"ok":"no found";}' ok |
擷取字串(substr使用)
1 2 |
[wangsl@centos5 ~]$ awk 'BEGIN{info="this is a test2010test!";print substr(info,4,10);}' s is a tes |
從第 4個 字元開始,擷取10個長度字串
字串分割(split使用)
1 2 3 4 5 6 |
[chengmo@centos5 ~]$ awk 'BEGIN{info="this is a test";split(info,tA," ");print length(tA);for(k in tA){print k,tA[k];}}' 4 4 test 1 this 2 is 3 a |
分割info,動態建立陣列tA,這裡比較有意思,awk for …in 迴圈,是一個無序的迴圈。 並不是從陣列下標1…n ,因此使用時候需要注意。
格式化字串輸出(sprintf使用)
格式化字串格式:
其中格式化字串包括兩部分內容: 一部分是正常字元, 這些字元將按原樣輸出; 另一部分是格式化規定字元, 以”%”開始, 後跟一個或幾個規定字元,用來確定輸出內容格式。
格式符 | 說明 |
%d | 十進位制有符號整數 |
%u | 十進位制無符號整數 |
%f | 浮點數 |
%s | 字串 |
%c | 單個字元 |
%p | 指標的值 |
%e | 指數形式的浮點數 |
%x | %X 無符號以十六進位制表示的整數 |
%o | 無符號以八進位制表示的整數 |
%g | 自動選擇合適的表示法 |
1 2 |
[chengmo@centos5 ~]$ awk 'BEGIN{n1=124.113;n2=-1.224;n3=1.2345; printf("%.2f,%.2u,%.2g,%X,%o\n",n1,n2,n3,n1,n1);}' 124.11,18446744073709551615,1.2,7C,174 |
三、一般函式是:
函式 | 說明 |
close( Expression ) | 用同一個帶字串值的 Expression 引數來關閉由 print 或 printf 語句開啟的或呼叫 getline 函式開啟的檔案或管道。如果檔案或管道成功關閉,則返回 0;其它情況下返回非零值。如果打算寫一個檔案,並稍後在同一個程式中讀取檔案,則 close 語句是必需的。 |
system(Command ) | 執行 Command 引數指定的命令,並返回退出狀態。等同於system 子例程。 |
Expression | getline [ Variable ] | 從來自 Expression 引數指定的命令的輸出中通過管道傳送的流中讀取一個輸入記錄,並將該記錄的值指定給 Variable 引數指定的變數。如果當前未開啟將 Expression 引數的值作為其命令名稱的流,則建立流。建立的流等同於呼叫 popen 子例程,此時 Command 引數取 Expression 引數的值且 Mode 引數設定為一個是 r 的值。只要流保留開啟且 Expression 引數求得同一個字串,則對 getline 函式的每次後續呼叫讀取另一個記錄。如果未指定 Variable 引數,則 $0 記錄變數和 NF 特殊變數設定為從流讀取的記錄。 |
getline [ Variable ] < Expression | 從 Expression 引數指定的檔案讀取輸入的下一個記錄,並將 Variable 引數指定的變數設定為該記錄的值。只要流保留開啟且 Expression 引數對同一個字串求值,則對 getline 函式的每次後續呼叫讀取另一個記錄。如果未指定 Variable 引數,則 $0 記錄變數和 NF 特殊變數設定為從流讀取的記錄。 |
getline [ Variable ] | 將 Variable 引數指定的變數設定為從當前輸入檔案讀取的下一個輸入記錄。如果未指定 Variable 引數,則 $0 記錄變數設定為該記錄的值,還將設定 NF、NR 和 FNR 特殊變數。 |
開啟外部檔案(close用法)
1 2 3 4 |
[chengmo@centos5 ~]$ awk 'BEGIN{while("cat /etc/passwd"|getline){print $0;};close("/etc/passwd");}' root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin |
逐行讀取外部檔案(getline使用方法)
1 2 3 4 |
[chengmo@centos5 ~]$ awk 'BEGIN{while(getline < "/etc/passwd"){print $0;};close("/etc/passwd");}' root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin |
1 2 3 4 |
[chengmo@centos5 ~]$ awk 'BEGIN{print "Enter your name:";getline name;print name;}' Enter your name: chengmo chengmo |
呼叫外部應用程式(system使用方法)
1 2 3 4 |
[chengmo@centos5 ~]$ awk 'BEGIN{b=system("ls -al");print b;}' total 42092 drwxr-xr-x 14 chengmo chengmo 4096 09-30 17:47 . drwxr-xr-x 95 root root 4096 10-08 14:01 .. |
b返回值,是執行結果。
四、時間函式
函式名 | 說明 |
mktime( YYYY MM DD HH MM SS[ DST]) | 生成時間格式 |
strftime([format [, timestamp]]) | 格式化時間輸出,將時間戳轉為時間字串 具體格式,見下表. |
systime() | 得到時間戳,返回從1970年1月1日開始到當前時間(不計閏年)的整秒數 |
建立指定時間(mktime使用)
1 2 3 4 5 |
[chengmo@centos5 ~]$ awk 'BEGIN{tstamp=mktime("2001 01 01 12 12 12");print strftime("%c",tstamp);}' 2001年01月01日 星期一 12時12分12秒 [chengmo@centos5 ~]$ awk 'BEGIN{tstamp1=mktime("2001 01 01 12 12 12");tstamp2=mktime("2001 02 01 0 0 0");print tstamp2-tstamp1;}' 2634468 |
求2個時間段中間時間差,介紹了strftime使用方法
1 2 |
[chengmo@centos5 ~]$ awk 'BEGIN{tstamp1=mktime("2001 01 01 12 12 12");tstamp2=systime();print tstamp2-tstamp1;}' 308201392 |
strftime日期和時間格式說明符
格式 | 描述 |
---|---|
%a | 星期幾的縮寫(Sun) |
%A | 星期幾的完整寫法(Sunday) |
%b | 月名的縮寫(Oct) |
%B | 月名的完整寫法(October) |
%c | 本地日期和時間 |
%d | 十進位制日期 |
%D | 日期 08/20/99 |
%e | 日期,如果只有一位會補上一個空格 |
%H | 用十進位制表示24小時格式的小時 |
%I | 用十進位制表示12小時格式的小時 |
%j | 從1月1日起一年中的第幾天 |
%m | 十進位制表示的月份 |
%M | 十進位制表示的分鐘 |
%p | 12小時表示法(AM/PM) |
%S | 十進位制表示的秒 |
%U | 十進位制表示的一年中的第幾個星期(星期天作為一個星期的開始) |
%w | 十進位制表示的星期幾(星期天是0) |
%W | 十進位制表示的一年中的第幾個星期(星期一作為一個星期的開始) |
%x | 重新設定本地日期(08/20/99) |
%X | 重新設定本地時間(12:00:00) |
%y | 兩位數字表示的年(99) |
%Y | 當前月份 |
%Z | 時區(PDT) |
%% | 百分號(%) |
以上是awk常見 內建函式使用及說明,希望對大家有所幫助。