『忘了再學』Shell基礎 — 31、字元處理相關命令

繁華似錦Fighting發表於2022-06-14

原文網址 : https://www.cnblogs.com/liuyuelinfighting/p/16373842.html

1、排序命令`sort`

（1）`sort`命令介紹

sort命令可針對文字檔案的內容，以行為單位來排序。

命令格式如下：

[root@localhost ~]# sort [選項] 檔名

選項：

-f：忽略大小寫。
-b：忽略每行前面的空白部分。
-n：以數值型進行排序，sort命令預設使用字串型排序。
-r：反向排序。
-u：刪除重複行。就是uniq命令。
-t：指定分隔符，sort命令預設的分隔符是製表符。
-k [n,m]：按照指定的欄位範圍排序。從第n欄位開始，m欄位結束（預設到行尾）。

（2）練習

以下練習預設文字內容如下：

java    haha    3
python  lala    77
shell   dudu    23
hello   world   12
linxu   xixi    6

1）示例1

sort命令預設是用每行開頭第一個字元來進行排序的。

執行sort排序命令：

# 預設按行首字元進行排序
[root@localhost tmp]# sort test.txt
hello   world   12
java    haha    3
linxu   xixi    6
python  lala    77
shell   dudu    23

如果想要反向排序，請使用-r選項：

# 反向排序
[root@localhost tmp]# sort -r test.txt
shell   dudu    23
python  lala    77
linxu   xixi    6
java    haha    3
hello   world   12

2）示例2

按照文件中，每行的指定欄位進行排序。

需要使用-k選項：

# -k 2,2表示：指定按照第二個欄位排序
# 2,2表示第2個欄位開始，到第2個欄位結束
[root@localhost tmp]# sort -k 2,2 test.txt
shell   dudu    23
java    haha    3
python  lala    77
hello   world   12
linxu   xixi    6

注意：文字中欄位之間的分隔是製表符，預設識別。

3）示例3

按照數字進行排序，根據文字中的內容，我們需要按照第三列進行排序。

[root@localhost tmp]# sort -k 3,3 test.txt
hello   world   12
shell   dudu    23
java    haha    3
linxu   xixi    6
python  lala    77

我們發現按照第三列內容進行排序的結果，有點不正確，3和6怎麼排在12的後邊了。

是因為sort命令並沒有把第三列的資料當作數字，預設是識別成字串，所以是按照字串的規則來排序的，也就是按第一位的數字進行排序的。

我們需要新增sort命令的-n選項，就可以解決上述問題了。也就是讓sort命令把第三列按數值進行排序。

[root@localhost tmp]# sort -n -k 3,3 test.txt
java    haha    3
linxu   xixi    6
hello   world   12
shell   dudu    23
python  lala    77

4）示例4

如果想要指定排序的欄位，並且文字中欄位間的分隔符不是製表符，這個時候就需要使用-t選項指定分隔符，並使用-k選項指定欄位號。

如下面文字：

java:haha:3
python:lala:77
shell:dudu:23
hello:world:12
linxu:xixi:6

需求：按文字內容中的第三列數字進行排序。

[root@localhost tmp]# sort -t ":" -n -k 3,3 test.txt
java:haha:3
linxu:xixi:6
hello:world:12
shell:dudu:23
python:lala:77

2、取消重複行命令`uniq`

uniq命令是用來取消重複行的命令，其實和sort -u選項是一樣的。

命令格式如下：

[root@localhost ~]# uniq [選項] 檔名

選項：
    -i：忽略大小寫。

練習：

student.txt文字內容如下：

ID      Name    Python  Linux   MySQL   Java
1       Tangs   88      87      86      85.55
2       Sunwk   99      98      97      96.66
2       Sunwk   99      98      97      96.66
3       Zhubj   77      76      75      74.44
3       Zhubj   77      76      75      74.44
4       Shahs   66      65      64      63.33
4       Shahs   66      65      64      63.33

我們可以看到student.txt文字的ID為2、3、4的資訊有重複。

使用uniq命令刪除重複的行後，有如下輸出結果：

[root@localhost tmp]# uniq student.txt
ID      Name    Python  Linux   MySQL   Java
1       Tangs   88      87      86      85.55
2       Sunwk   99      98      97      96.66
3       Zhubj   77      76      75      74.44
4       Shahs   66      65      64      63.33

更多參考可以檢視：https://www.runoob.com/linux/linux-comm-uniq.html

3、統計命令`wc`

wc命令是統計文件中行數，字元數，位元組數等資訊。

命令格式如下：

[root@localhost ~]# wc [選項] 檔名
選項：
    -l：只統計行數
    -w：只統計單詞數
    -m：只統計字元數

練習1：

在預設的情況下，wc命令將計算指定檔案的行數、字數，以及位元組數。

# 行數為5、單詞數30、位元組數124
[root@localhost tmp]# wc student.txt
  5  30 124 student.txt

練習2：

檢視特定的統計資訊，只看行數和位元組數。

# 行數為5、位元組數124
[root@localhost tmp]# wc -lm student.txt
  5 124 student.txt

練習3：

同時檢視多個檔案的統計資訊。

[root@localhost tmp]# wc student.txt test2.txt
  5  30 124 student.txt
  8  37 318 test2.txt
 13  67 442 總用量

更多參看可以檢視：https://www.runoob.com/linux/linux-comm-wc.html

『忘了再學』Shell基礎 — 26、cut列提取命令
2022-06-07
『忘了再學』Shell基礎 — 30、sed命令的使用
2022-06-13
『忘了再學』Shell基礎 — 32、Shell中test測試命令詳解
2022-06-15
『忘了再學』Shell基礎 — 4、Bash基本功能（history命令）
2022-03-28
『忘了再學』Shell基礎 — 3、echo命令的介紹與使用
2022-03-25
『忘了再學』Shell基礎 — 20、Shell中的運算子
2022-05-26
『忘了再學』Shell基礎 — 19、使用declare命令宣告變數型別
2022-05-25
變數型別
『忘了再學』Shell基礎 — 2、Shell的作用與分類
2021-12-18
『忘了再學』Shell基礎 — 8、管道符介紹
2022-04-07
『忘了再學』Shell基礎 — 24、Shell正規表示式的使用
2022-06-01
『忘了再學』Shell基礎 — 14、環境變數（二）
2022-05-19
變數
『忘了再學』Shell基礎 — 13、環境變數（一）
2022-05-18
變數
『忘了再學』Shell基礎 — 29、AWK內建變數
2022-06-10
變數
『忘了再學』Shell基礎 — 15、環境變數（三）
2022-05-20
變數
『忘了再學』Shell基礎 — 17、預定義變數
2022-05-24
變數
『忘了再學』Shell基礎 — 16、位置引數變數
2022-05-23
變數
『忘了再學』Shell基礎 — 7、Bash基本功能（多命令順序執行）
2022-03-31
『忘了再學』Shell基礎 — 25、擴充套件正規表示式
2022-06-06
套件
『忘了再學』Shell基礎 — 9、Bash中的特殊符號（一）
2022-04-11
符號
『忘了再學』Shell基礎 — 10、Bash中的特殊符號（二）
2022-04-11
符號
『忘了再學』Shell基礎 — 12、使用者自定義變數
2022-05-17
變數
『忘了再學』Shell基礎 — 28、AWK中條件表示式說明
2022-06-09
『忘了再學』Shell基礎 — 23、其他環境變數配置檔案
2022-05-31
變數
webpack基礎–css相關處理
2018-07-16
WebCSS
『學了就忘』Linux基礎命令 — 31、grep命令和萬用字元
2021-11-08
Linux字元
『忘了再學』Shell基礎 — 21、變數的測試與內容置換
2022-05-27
變數
『忘了再學』Shell基礎 — 11、變數定義的規則和分類
2022-04-13
變數
『忘了再學』Shell基礎 — 27、AWK程式設計的介紹和基本使用
2022-06-08
程式設計
『忘了再學』Shell基礎 — 6、Bash基本功能（輸入輸出重定向）
2022-03-30
『忘了再學』Shell基礎 — 22、主要的環境變數配置檔案說明
2022-05-30
變數
shell 基礎命令
2019-04-05
『忘了再學』Shell流程控制 — 36、for迴圈介紹
2022-06-21
『學了就忘』Linux基礎命令 — 34、配置網路相關命令
2021-11-10
Linux
『學了就忘』Linux基礎命令 — 27、搜尋操作相關命令
2021-11-06
Linux
平衡車相關理論基礎
2024-11-20
『學了就忘』Linux基礎命令 — 20、檔案操作的相關命令
2021-11-03
Linux
『學了就忘』Linux基礎命令 — 19、目錄操作的相關命令
2021-11-03
Linux
『忘了再學』Shell流程控制 — 39、特殊流程控制語句
2022-06-23

『忘了再學』Shell基礎 — 31、字元處理相關命令

1、排序命令sort

（1）sort命令介紹

（2）練習

2、取消重複行命令uniq

3、統計命令wc

相關文章

1、排序命令`sort`

（1）`sort`命令介紹

2、取消重複行命令`uniq`

3、統計命令`wc`