由於awk陣列,是關聯陣列。for…in迴圈輸出時候,預設列印出來是無序陣列。
1 2 3 4 5 |
[chengmo@ localhost ~]$ awk 'BEGIN{info = "this is a test";split(info,tA," ");for(k in tA){print k,tA[k];}}' 4 test 1 this 2 is 3 a |
如果需要按照順序輸出,通過鍵值定位方式輸出。
1 2 3 4 5 |
[chengmo@ localhost ~]$ awk 'BEGIN{info = "this is a test";slen=split(info,tA," ");for(i=1;i<=slen;i++){print i,tA[i];}}' 1 this 2 is 3 a 4 test |
一、通過內建函式(asort,asorti使用) awk 3.1以上版本才支援
- asort使用說明
srcarrlen=asort[srcarr,dscarr] 預設返回值是:原陣列長度,傳入引數dscarr則將排序後陣列賦值給dscarr.
1 2 3 4 5 6 7 8 9 10 11 |
[chengmo@ localhost ~]$ awk 'BEGIN{ a[100]=100; a[2]=224; a[3]=34; slen=asort(a,tA); for(i=1;i<=slen;i++) {print i,tA[i];} }' 1 34 2 100 3 224 |
asort只對值進行了排序,因此丟掉原先鍵值。
2、asorti 使用說明
1 2 3 4 5 6 7 8 9 10 11 |
[chengmo@ localhost ~]$ awk 'BEGIN{ a["d"]=100; a["a"]=224; a["c"]=34; slen=asorti(a,tA); for(i=1;i<=slen;i++) {print i,tA[i],a[tA[i]];} }' 1 a 224 2 c 34 3 d 100 |
asorti對鍵值 進行排序(字串型別),將生成新的陣列放入:tA中。
二、通過管道傳送到sort排序
1 2 3 4 5 6 7 8 9 10 |
[chengmo@ localhost ~]$awk 'BEGIN{ a[100]=100; a[2]=224; a[3]=34; for(i in a) {print i,a[i] | "sort -r -n -k2";} }' 2 224 100 100 3 34 |
通過管道,傳送到外部程式“sort”排序,-r 從大到小,-n 按照數字排序,-k2 以第2列排序。通過將資料丟給第3方的sort命令,所有問題變得非常簡單。如果以key值排序 –k2 變成 -k1即可。
1 2 3 4 5 6 7 8 9 10 |
[chengmo@ localhost ~]$ awk 'BEGIN{ a[100]=100; a[2]=224; a[3]=34; for(i in a) {print i,a[i] | "sort -r -n -k1";} }' 100 100 3 34 2 224 |
三、自定義排序函式
- awk自定義函式結構:
1 2 3 4 5 6 7 8 9 |
function funname(p1,p2,p3) { staction; return value; } |
以上是:awk自定義函式表示方式,預設傳入引數都是以引用方式傳入,return值,只能是字元型或者數值型。 不能返回陣列型別。 如果返回陣列型別。需要通過形參 方式傳入。再獲得。
awk返回陣列型別
1 2 3 4 5 6 7 8 9 10 11 12 |
awk 'function test(ary){ for(i=0;i<10;i++){ ary[i]=i; } return i; } BEGIN{ n=test(array); for(i=0;i<n;i++){ print array[i]; } } |
- 排序函式
#arr 傳入一維陣列
#key 排序型別 1是按照值排序 2按照鍵值
#datatype 比較型別 1按照數字排序 2按照字串排序
#tarr 排序返回的陣列
#splitseq 分割字串 陣列中鍵與值之間分割字串
#return 陣列長度
#實現思路,將原始陣列a[‘a’]=100 排序後變成 a[1]=a分隔符100 ,然後按照下標遞迴顯示內容。 本排序使用冒泡方式進行。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 |
function sortArr(arr,key,datatype,tarr,splitseq) { if(key ~ /[^1-2]/) {return tarr;} for(k in arr) { tarr[++alen]=(k""splitseq""arr[k]); } for(m=1;m<=alen;m++) { for(n=1;n<=alen-m-1;n++) { split(tarr[m],tm,splitseq); split(tarr[n+1],tn,splitseq); tnum=tarr[m]; if(datatype==1) { if(tm[key]+0<tn[key]+0) { tarr[m]=tarr[n+1]; tarr[n+1]=tnum; } } else { if((tm[key]"") < (tn[key]"")) { tarr[m]=tarr[n+1]; tarr[n+1]=tnum; } } } } return alen; } |
完整程式碼如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 |
[chengmo@centos5 ~]$ awk 'BEGIN{ a["a"]=100; a["b"]=110; a["c"]=10; splitseq="%%"; alen=sortArr(a,2,1,tarr,splitseq); for(m=1;m<=alen;m++) { split(tarr[m],ta,splitseq); print m,ta[1],ta[2]; } } function sortArr(arr,key,datatype,tarr,splitseq) { if(key ~ /[^1-2]/) {return tarr;} for(k in arr) { tarr[++alen]=(k""splitseq""arr[k]); } for(m=1;m<=alen;m++) { for(n=1;n<=alen-m-1;n++) { split(tarr[m],tm,splitseq); split(tarr[n+1],tn,splitseq); tnum=tarr[m]; if(datatype==1) { if(tm[key]+0<tn[key]+0) { tarr[m]=tarr[n+1]; tarr[n+1]=tnum; } } else { if((tm[key]"") < (tn[key]"")) { tarr[m]=tarr[n+1]; tarr[n+1]=tnum; } } } } return alen; } ' 1 b 110 2 a 100 3 c 10 |
以上是awk陣列排序一些方法。對於少量資料排序,就效能而言,使用自定義函式效能要高,不需要另外再開啟程式。對於大量資料,排序第2種方法還是很不錯的。