Linux Awk 陣列操作詳細介紹

發表於2015-10-09

用awk進行文字處理，少不了就是它的陣列處理。那麼awk陣列有那些特點，一般常見運算又會怎麼樣呢。我們先看下下面的一些介紹，結合例子我們會講解下它的不同之處。在 awk 中陣列叫做關聯陣列(associative arrays)，因為下標記可以是數也可以是串。awk 中的陣列不必提前宣告，也不必宣告大小。陣列元素用 0 或空串來初始化，這根據上下文而定。例如：

一、定義方法

1：可以用數值作陣列索引(下標)

Tarray[1]=“cheng mo”
Tarray[2]=“800927”

2：可以用字串作陣列索引(下標)

Tarray[“first”]=“cheng ”
Tarray[“last”]=”mo”
Tarray[“birth”]=”800927”

使用中 print Tarray[1] 將得到”cheng mo” 而 print Tarray[2] 和 print[“birth”] 都將得到 ”800927” 。

二、陣列相關函式

[chengmo@localhost ~]$ awk --version
GNU Awk 3.1.5

1 2	[chengmo@localhost ~]$ awk --version GNU Awk 3.1.5

使用版本是：3.1以上，不同版本下面函式不一定相同

得到陣列長度（length方法使用）

[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";lens=split(info,tA," ");print length(tA),lens;}'
4 4

1 2	[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";lens=split(info,tA," ");print length(tA),lens;}' 4 4

length返回字串以及陣列長度，split進行分割字串為陣列，也會返回分割得到陣列長度。

(asort使用）:

[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";split(info,tA," ");print asort(tA);}'
4

1 2	[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";split(info,tA," ");print asort(tA);}' 4

asort對陣列進行排序，返回陣列長度。

輸出陣列內容(無序，有序輸出）：

[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";split(info,tA," ");for(k in tA){print k,tA[k];}}'
4 test
1 it
2 is
3 a

[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";split(info,tA," ");for(k in tA){print k,tA[k];}}'

4 test

1 it

2 is

3 a

for…in 輸出，因為陣列是關聯陣列，預設是無序的。所以通過for…in 得到是無序的陣列。如果需要得到有序陣列，需要通過下標獲得。

[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";tlen=split(info,tA," ");for(k=1;k<=tlen;k++){print k,tA[k];}}' 
1 it
2 is
3 a
4 test

[chengmo@localhost ~]$ awk 'BEGIN{info="it is a test";tlen=split(info,tA," ");for(k=1;k<=tlen;k++){print k,tA[k];}}'

1 it

2 is

3 a

4 test

注意：陣列下標是從1開始，與c陣列不一樣。

判斷鍵值存在以及刪除鍵值：

一個錯誤的判斷方法：

[chengmo@localhost ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if(tB["c"]!="1"){print "no found";};for(k in tB){print k,tB[k];}}' 
no found
a a1
b b1
c

[chengmo@localhost ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if(tB["c"]!="1"){print "no found";};for(k in tB){print k,tB[k];}}'

no found

a a1

b b1

以上出現奇怪問題，tB[“c”]沒有定義，但是迴圈時候，發現已經存在該鍵值，它的值為空，這裡需要注意，awk陣列是關聯陣列，只要通過陣列引用它的key，就會自動建立改序列.

正確判斷方法：

[chengmo@localhost ~]$ awk ‘BEGIN{tB[“a”]=”a1″;tB[“b”]=”b1″;if( “c” in tB){print “ok”;};for(k in tB){print k,tB[k];}}’
a a1
b b1

if(key in array) 通過這種方法判斷陣列中是否包含”key”鍵值。

刪除鍵值：

[chengmo@localhost ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";delete tB["a"];for(k in tB){print k,tB[k];}}' 
b b1

1 2	[chengmo@localhost ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";delete tB["a"];for(k in tB){print k,tB[k];}}' b b1

delete array[key]可以刪除，對應陣列key的，序列值。

三、二維陣列使用(多維陣列使用）

awk的多維陣列在本質上是一維陣列，更確切一點，awk在儲存上並不支援多維陣列。awk提供了邏輯上模擬二維陣列的訪問方式。例如，array[2,4] = 1這樣的訪問是允許的。awk使用一個特殊的字串SUBSEP (34)作為分割欄位，在上面的例子中，關聯陣列array儲存的鍵值實際上是2344。

類似一維陣列的成員測試，多維陣列可以使用 if ( (i,j) in array)這樣的語法，但是下標必須放置在圓括號中。
類似一維陣列的迴圈訪問，多維陣列使用 for ( item in array )這樣的語法遍歷陣列。與一維陣列不同的是，多維陣列必須使用split()函式來訪問單獨的下標分量。split ( item, subscr, SUBSEP)

[chengmo@localhost ~]$ awk 'BEGIN{

for(i=1;i<=9;i++)
{
  for(j=1;j<=9;j++)  
  {
tarr[i,j]=i*j;
print i,"*",j,"=",tarr[i,j];
  }
}
}'
1 * 1 = 1
1 * 2 = 2
1 * 3 = 3
1 * 4 = 4
1 * 5 = 5
1 * 6 = 6

……

[chengmo@localhost ~]$ awk 'BEGIN{

for(i=1;i<=9;i++)

{

for(j=1;j<=9;j++)

{

tarr[i,j]=i*j;

print i,"*",j,"=",tarr[i,j];

}

1 * 1 = 1

1 * 2 = 2

1 * 3 = 3

1 * 4 = 4

1 * 5 = 5

1 * 6 = 6

……

可以通過array[k,k2]引用獲得陣列內容.

方法二：

[chengmo@localhost ~]$ awk 'BEGIN{
for(i=1;i<=9;i++)
{
  for(j=1;j<=9;j++)  
  {
tarr[i,j]=i*j;
  }
}
for(m in tarr)              
{

split(m,tarr2,SUBSEP);
print tarr2[1],"*",tarr2[2],"=",tarr[m];
}
}'

[chengmo@localhost ~]$ awk 'BEGIN{

for(i=1;i<=9;i++)

{

for(j=1;j<=9;j++)

{

tarr[i,j]=i*j;

}

for(m in tarr)

{

split(m,tarr2,SUBSEP);

print tarr2[1],"*",tarr2[2],"=",tarr[m];

}

以上是awk對陣列的處理相關，希望對大家有用。

AWK 陣列介紹
2020-10-06
陣列
Linux Awk 內建函式詳細介紹（例項）
2015-10-08
Linux函式
Linux Shell Awk 流程控制語句（if,for,while,do)詳細介紹
2015-10-07
LinuxWhile
javascript陣列操作簡單介紹
2017-03-15
JavaScript陣列
awk 流程控制語句（if,for,while,do)詳細介紹
2014-03-12
While
詳細介紹Linux指令od
2016-07-10
Linux
Linux下udev詳細介紹
2017-07-22
Linuxdev
linux awk 陣列和迴圈
2015-04-22
Linux陣列
Shell 陣列介紹
2019-11-03
陣列
javascript this詳細介紹
2019-06-09
JavaScript
JDBC 詳細介紹
2021-12-30
JDBC
Kafka詳細介紹
2018-09-05
Kafka
Git詳細介紹
2020-12-14
Git
Linux 磁碟組劃分詳細介紹
2015-09-23
Linux
Linux ls命令最詳細用法介紹
2014-07-29
Linux
Linux Grep命令使用的詳細介紹
2009-12-15
Linux
Go Channel 詳細介紹
2021-07-06
Go
Nacos 介面詳細介紹
2021-08-02
MQ詳細命令介紹
2017-05-09
MQ
Recovery命令詳細介紹
2014-04-15
Vmstat 命令詳細介紹
2008-01-31
Linux下ulimit命令的詳細使用介紹
2016-06-21
LinuxMIT
詳細介紹Linux finger命令的使用
2016-07-17
Linux
[Shell] awk 陣列(2)
2016-05-05
陣列
[Shell] awk 陣列(1)
2016-04-27
陣列
Linux awk命令中如何刪除陣列
2024-07-10
Linux陣列
【乾貨】js 陣列詳細操作方法及解析合集
2018-05-31
JS陣列
thinkPHP空模組和空操作、前置操作和後置操作詳細介紹（十四）
2015-06-23
PHP
全面介紹JavaScript陣列方法
2020-01-15
JavaScript陣列
ES6 陣列介紹
2020-06-24
陣列
Linux Awk 內建變數使用介紹
2015-10-08
Linux變數
RabbitMQ訊息佇列（一）: Detailed Introduction 詳細介紹
2017-11-30
MQ佇列AI
Linux下安裝與使用MySQL詳細介紹
2021-09-09
LinuxMySql
Signal ()函式詳細介紹 Linux函式
2016-07-08
函式Linux
Flutter系列（一）——詳細介紹
2020-02-17
Flutter
Nginx服務詳細介紹
2020-04-08
Nginx
python字典詳細介紹
2020-05-24
Python
Spring bean詳細介紹
2019-03-23
SpringBean

Linux Awk 陣列操作詳細介紹

相關文章