Awk 陣列排序多種實現方法

發表於2015-10-10

由於awk陣列，是關聯陣列。for…in迴圈輸出時候，預設列印出來是無序陣列。

[chengmo@ localhost ~]$ awk 'BEGIN{info = "this is a test";split(info,tA," ");for(k in tA){print k,tA[k];}}'
4 test
1 this
2 is
3 a

[chengmo@ localhost ~]$ awk 'BEGIN{info = "this is a test";split(info,tA," ");for(k in tA){print k,tA[k];}}'

4 test

1 this

2 is

3 a

如果需要按照順序輸出，通過鍵值定位方式輸出。

[chengmo@ localhost ~]$ awk 'BEGIN{info = "this is a test";slen=split(info,tA," ");for(i=1;i<=slen;i++){print i,tA[i];}}' 
1 this
2 is
3 a
4 test

[chengmo@ localhost ~]$ awk 'BEGIN{info = "this is a test";slen=split(info,tA," ");for(i=1;i<=slen;i++){print i,tA[i];}}'

1 this

2 is

3 a

4 test

一、通過內建函式（asort,asorti使用) awk 3.1以上版本才支援

asort使用說明

srcarrlen=asort[srcarr,dscarr] 預設返回值是：原陣列長度，傳入引數dscarr則將排序後陣列賦值給dscarr.

[chengmo@ localhost ~]$ awk 'BEGIN{
a[100]=100;
a[2]=224;
a[3]=34;
slen=asort(a,tA);
for(i=1;i<=slen;i++)
{print i,tA[i];}
}'
1 34
2 100
3 224

[chengmo@ localhost ~]$ awk 'BEGIN{

a[100]=100;

a[2]=224;

a[3]=34;

slen=asort(a,tA);

for(i=1;i<=slen;i++)

{print i,tA[i];}

1 34

2 100

3 224

asort只對值進行了排序，因此丟掉原先鍵值。

2、asorti 使用說明

[chengmo@ localhost ~]$ awk 'BEGIN{
a["d"]=100;
a["a"]=224;
a["c"]=34;
slen=asorti(a,tA);
for(i=1;i<=slen;i++)
{print i,tA[i],a[tA[i]];}
}'
1 a 224
2 c 34
3 d 100

[chengmo@ localhost ~]$ awk 'BEGIN{

a["d"]=100;

a["a"]=224;

a["c"]=34;

slen=asorti(a,tA);

for(i=1;i<=slen;i++)

{print i,tA[i],a[tA[i]];}

1 a 224

2 c 34

3 d 100

asorti對鍵值進行排序（字串型別），將生成新的陣列放入：tA中。

二、通過管道傳送到sort排序

[chengmo@ localhost ~]$awk 'BEGIN{
a[100]=100;
a[2]=224;
a[3]=34;
for(i in a)
{print i,a[i] | "sort -r -n -k2";}
}'
2 224
100 100
3 34

[chengmo@ localhost ~]$awk 'BEGIN{

a[100]=100;

a[2]=224;

a[3]=34;

for(i in a)

{print i,a[i] | "sort -r -n -k2";}

2 224

100 100

3 34

通過管道，傳送到外部程式“sort”排序，-r 從大到小，-n 按照數字排序，-k2 以第2列排序。通過將資料丟給第3方的sort命令，所有問題變得非常簡單。如果以key值排序 –k2 變成 -k1即可。

[chengmo@ localhost ~]$ awk 'BEGIN{
a[100]=100;
a[2]=224;
a[3]=34;
for(i in a)
{print i,a[i] | "sort -r -n -k1";}
}'
100 100
3 34
2 224

[chengmo@ localhost ~]$ awk 'BEGIN{

a[100]=100;

a[2]=224;

a[3]=34;

for(i in a)

{print i,a[i] | "sort -r -n -k1";}

100 100

3 34

2 224

三、自定義排序函式

awk自定義函式結構：

function funname(p1,p2,p3)

{

    staction;

    return value;

}

function funname(p1,p2,p3)

{

staction;

return value;

}

以上是：awk自定義函式表示方式，預設傳入引數都是以引用方式傳入，return值，只能是字元型或者數值型。不能返回陣列型別。如果返回陣列型別。需要通過形參方式傳入。再獲得。

awk返回陣列型別

awk 'function test(ary){
 for(i=0;i<10;i++){
  ary[i]=i;
 }
 return i;
}
BEGIN{
 n=test(array);
 for(i=0;i<n;i++){
  print array[i];
 }
}

awk 'function test(ary){

for(i=0;i<10;i++){

ary[i]=i;

}

return i;

}

BEGIN{

n=test(array);

for(i=0;i<n;i++){

print array[i];

}

排序函式

#arr 傳入一維陣列

#key 排序型別 1是按照值排序 2按照鍵值

#datatype 比較型別 1按照數字排序 2按照字串排序

#tarr 排序返回的陣列

#splitseq 分割字串陣列中鍵與值之間分割字串

#return 陣列長度

#實現思路，將原始陣列a[‘a’]=100 排序後變成 a[1]=a分隔符100 ，然後按照下標遞迴顯示內容。本排序使用冒泡方式進行。

function sortArr(arr,key,datatype,tarr,splitseq)
{

    if(key ~ /[^1-2]/) 
    {return tarr;}
    for(k in arr)
    {
      tarr[++alen]=(k""splitseq""arr[k]);
    }

    for(m=1;m<=alen;m++)
    {
        for(n=1;n<=alen-m-1;n++)
        {
            split(tarr[m],tm,splitseq);
            split(tarr[n+1],tn,splitseq);

                tnum=tarr[m];
            if(datatype==1)
            {
                if(tm[key]+0<tn[key]+0)
                {
                     tarr[m]=tarr[n+1];
                     tarr[n+1]=tnum;
                }
            }
            else
            {
                if((tm[key]"") < (tn[key]""))
                {
                     tarr[m]=tarr[n+1];
                     tarr[n+1]=tnum;
                }
            }
        }
    }
    return alen;
}

function sortArr(arr,key,datatype,tarr,splitseq)

{

if(key ~ /[^1-2]/)

{return tarr;}

for(k in arr)

{

tarr[++alen]=(k""splitseq""arr[k]);

}

for(m=1;m<=alen;m++)

{

for(n=1;n<=alen-m-1;n++)

{

split(tarr[m],tm,splitseq);

split(tarr[n+1],tn,splitseq);

tnum=tarr[m];

if(datatype==1)

{

if(tm[key]+0<tn[key]+0)

{

tarr[m]=tarr[n+1];

tarr[n+1]=tnum;

}

else

{

if((tm[key]"") < (tn[key]""))

{

tarr[m]=tarr[n+1];

tarr[n+1]=tnum;

}

return alen;

}

完整程式碼如下：

[chengmo@centos5 ~]$ awk 'BEGIN{
a["a"]=100;
a["b"]=110;
a["c"]=10;
splitseq="%%";
alen=sortArr(a,2,1,tarr,splitseq);
for(m=1;m<=alen;m++)
{
    split(tarr[m],ta,splitseq);
    print m,ta[1],ta[2];
}
}
function sortArr(arr,key,datatype,tarr,splitseq)
{

    if(key ~ /[^1-2]/) 
    {return tarr;}
    for(k in arr)
    {
      tarr[++alen]=(k""splitseq""arr[k]);
    }

    for(m=1;m<=alen;m++)
    {
        for(n=1;n<=alen-m-1;n++)
        {
            split(tarr[m],tm,splitseq);
            split(tarr[n+1],tn,splitseq);

                tnum=tarr[m];
            if(datatype==1)
            {
                if(tm[key]+0<tn[key]+0)
                {
                     tarr[m]=tarr[n+1];
                     tarr[n+1]=tnum;
                }
            }
            else
            {
                if((tm[key]"") < (tn[key]""))
                {
                     tarr[m]=tarr[n+1];
                     tarr[n+1]=tnum;
                }
            }
        }
    }
    return alen;
}
'

1 b 110
2 a 100
3 c 10

[chengmo@centos5 ~]$ awk 'BEGIN{

a["a"]=100;

a["b"]=110;

a["c"]=10;

splitseq="%%";

alen=sortArr(a,2,1,tarr,splitseq);

for(m=1;m<=alen;m++)

{

split(tarr[m],ta,splitseq);

print m,ta[1],ta[2];

}

function sortArr(arr,key,datatype,tarr,splitseq)

{

if(key ~ /[^1-2]/)

{return tarr;}

for(k in arr)

{

tarr[++alen]=(k""splitseq""arr[k]);

}

for(m=1;m<=alen;m++)

{

for(n=1;n<=alen-m-1;n++)

{

split(tarr[m],tm,splitseq);

split(tarr[n+1],tn,splitseq);

tnum=tarr[m];

if(datatype==1)

{

if(tm[key]+0<tn[key]+0)

{

tarr[m]=tarr[n+1];

tarr[n+1]=tnum;

}

else

{

if((tm[key]"") < (tn[key]""))

{

tarr[m]=tarr[n+1];

tarr[n+1]=tnum;

}

return alen;

}

1 b 110

2 a 100

3 c 10

以上是awk陣列排序一些方法。對於少量資料排序，就效能而言，使用自定義函式效能要高，不需要另外再開啟程式。對於大量資料，排序第2種方法還是很不錯的。

歸併排序：陣列和連結串列的多種實現
2021-11-11
排序陣列
陣列排序的實現
2019-03-31
陣列排序
7種方法實現陣列去重
2018-05-05
陣列
多維陣列排序
2021-09-03
陣列排序
PHP 實現按奇偶排序陣列
2020-04-23
PHP排序陣列
PHP 多維陣列排序
2024-05-27
PHP陣列排序
JS實現陣列去重方法總結(六種方法)
2018-05-17
JS陣列
AWK 陣列介紹
2020-10-06
陣列
Javascript陣列排序sort方法和自定義排序方法
2018-05-26
JavaScript陣列排序
陣列進行排序的方法
2023-03-15
陣列排序
【演算法-初級-陣列】刪除排序陣列中的重複項（多語言版實現）
2022-01-16
演算法陣列排序
GO 陣列-多種定義
2020-06-14
Go陣列
多維陣列轉一維陣列（降維的多種方式）
2019-11-21
陣列
陣列排序
2024-03-31
陣列排序
[20191202]awk使用陣列技巧.txt
2019-12-02
陣列
Java中查詢陣列多數元素的4種方法
2024-03-17
Java陣列
5種方式實現陣列扁平化
2018-05-16
陣列
使用sort方法實現陣列升序降序
2021-11-06
陣列
玩轉陣列各種方法
2018-08-01
陣列
PHP陣列多個欄位分別排序
2019-02-16
PHP陣列排序
1117清空陣列的多種方式
2020-11-18
陣列
快速排序的三種實現方法（C++）
2018-05-08
排序C++
python多維陣列切片方法
2023-03-30
Python陣列
js陣列排序
2024-08-18
JS陣列排序
JavaScript 陣列排序
2024-06-27
JavaScript陣列排序
物件陣列排序
2020-11-04
物件陣列排序
陣列的排序
2018-09-19
陣列排序
Python佇列的三種佇列實現方法
2020-04-19
Python佇列
教你如何運用golang 實現陣列的隨機排序
2022-03-06
Golang陣列隨機排序
PAT乙級——1092（陣列排序自定義sort）Java實現
2018-12-10
陣列排序Java
實現陣列的隨機排序（含洗牌演算法）
2019-03-05
陣列隨機排序演算法
3種常見的Web前端陣列排序方式！
2021-04-20
Web前端陣列排序
自己實現陣列的 `map`、`filter`、`find` 方法
2024-11-26
陣列Filter
遍歷陣列的幾種方法
2020-10-01
陣列
JS陣列去重7種方法
2021-12-03
JS陣列
陣列去重的幾種方法
2020-10-10
陣列
陣列去重的六種方法
2019-03-05
陣列
多維陣列按鍵名進行重新排序
2019-11-14
陣列排序
資料結構實驗多維陣列的實現
2020-11-18
資料結構陣列

Awk 陣列排序多種實現方法

相關文章