用awk進行文字處理,少不了就是它的陣列處理。那麼awk陣列有那些特點,一般常見運算又會怎麼樣呢。我們先看下下面的一些介紹,結合例子我們會講解下它的不同之處。在 awk 中陣列叫做關聯陣列(associative arrays),因為下標記可以是數也可以是串。awk 中的陣列不必提前宣告,也不必宣告大小。陣列元素用 0 或空串來初始化,這根據上下文而定。例如:
一、定義方法
1:可以用數值作陣列索引(下標)
Tarray[1]=“cheng mo”
Tarray[2]=“800927”
2:可以用字串作陣列索引(下標)
Tarray[“first”]=“cheng ”
Tarray[“last”]=”mo”
Tarray[“birth”]=”800927”
使用中 print Tarray[1] 將得到”cheng mo” 而 print Tarray[2] 和 print[“birth”] 都將得到 ”800927” 。
二、陣列相關函式
1 2 |
[chengmo@localhost ~]$ awk --version GNU Awk 3.1.5 |
使用版本是:3.1以上,不同版本下面函式不一定相同
- 得到陣列長度(length方法使用)
1 2 |
[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";lens=split(info,tA," ");print length(tA),lens;}' 4 4 |
length返回字串以及陣列長度,split進行分割字串為陣列,也會返回分割得到陣列長度。
(asort使用):
1 2 |
[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";split(info,tA," ");print asort(tA);}' 4 |
asort對陣列進行排序,返回陣列長度。
- 輸出陣列內容(無序,有序輸出):
1 2 3 4 5 |
[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";split(info,tA," ");for(k in tA){print k,tA[k];}}' 4 test 1 it 2 is 3 a |
for…in 輸出,因為陣列是關聯陣列,預設是無序的。所以通過for…in 得到是無序的陣列。如果需要得到有序陣列,需要通過下標獲得。
1 2 3 4 5 |
[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";tlen=split(info,tA," ");for(k=1;k<=tlen;k++){print k,tA[k];}}' 1 it 2 is 3 a 4 test |
注意:陣列下標是從1開始,與c陣列不一樣。
- 判斷鍵值存在以及刪除鍵值:
一個錯誤的判斷方法:
1 2 3 4 5 |
[chengmo@localhost ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if(tB["c"]!="1"){print "no found";};for(k in tB){print k,tB[k];}}' no found a a1 b b1 c |
以上出現奇怪問題,tB[“c”]沒有定義,但是迴圈時候,發現已經存在該鍵值,它的值為空,這裡需要注意,awk陣列是關聯陣列,只要通過陣列引用它的key,就會自動建立改序列.
正確判斷方法:
[chengmo@localhost ~]$ awk ‘BEGIN{tB[“a”]=”a1″;tB[“b”]=”b1″;if( “c” in tB){print “ok”;};for(k in tB){print k,tB[k];}}’
a a1
b b1
if(key in array) 通過這種方法判斷陣列中是否包含”key”鍵值。
刪除鍵值:
1 2 |
[chengmo@localhost ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";delete tB["a"];for(k in tB){print k,tB[k];}}' b b1 |
delete array[key]可以刪除,對應陣列key的,序列值。
三、二維陣列使用(多維陣列使用)
awk的多維陣列在本質上是一維陣列,更確切一點,awk在儲存上並不支援多維陣列。awk提供了邏輯上模擬二維陣列的訪問方式。例 如,array[2,4] = 1這樣的訪問是允許的。awk使用一個特殊的字串SUBSEP (34)作為分割欄位,在上面的例子中,關聯陣列array儲存的鍵值實際上是2344。
類似一維陣列的成員測試,多維陣列可以使用 if ( (i,j) in array)這樣的語法,但是下標必須放置在圓括號中。
類似一維陣列的迴圈訪問,多維陣列使用 for ( item in array )這樣的語法遍歷陣列。與一維陣列不同的是,多維陣列必須使用split()函式來訪問單獨的下標分量。split ( item, subscr, SUBSEP)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
[chengmo@localhost ~]$ awk 'BEGIN{ for(i=1;i<=9;i++) { for(j=1;j<=9;j++) { tarr[i,j]=i*j; print i,"*",j,"=",tarr[i,j]; } } }' 1 * 1 = 1 1 * 2 = 2 1 * 3 = 3 1 * 4 = 4 1 * 5 = 5 1 * 6 = 6 …… |
可以通過array[k,k2]引用獲得陣列內容.
方法二:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
[chengmo@localhost ~]$ awk 'BEGIN{ for(i=1;i<=9;i++) { for(j=1;j<=9;j++) { tarr[i,j]=i*j; } } for(m in tarr) { split(m,tarr2,SUBSEP); print tarr2[1],"*",tarr2[2],"=",tarr[m]; } }' |
以上是awk對陣列的處理相關,希望對大家有用。