運用sed命令高效地刪除檔案的特定行

安全劍客發表於2020-09-06
正常來說,我們想要刪除檔案中的某些行內容,一般都是先開啟這個檔案,然後找到要刪除的內容,再然後選中這些行並按刪除鍵進行刪除,這在資料量很少時是沒有問題的。但是,一旦檔案中的行資料非常多,而且資料冗雜的情況下,你還要用上面的方法去做的話就很恐怖了。為此,今天這篇文章將帶大家一起學習運用 sed  行工具,即使在資料多而雜的情況下也能高效而優雅地刪除檔案中的特定行內容。

運用sed命令高效地刪除檔案的特定行運用sed命令高效地刪除檔案的特定行
ed 是 Stream Editor 的簡寫,它用於在   中進行基本的文字轉換,是檔案操作的一個重要 ,所以,我們也可以用它來實現文字的刪除操作。

下面是一些 sed 命令的使用示例,覆蓋了大多數的使用場景,由淺入深地幫助你學習 sed 命令,讓你輕鬆地實現高效刪除檔案的特定行內容。

首先我們準備一個演示檔案 sed-demo.txt

# cat sed-demo.txt
1 Linux Operating System
2 Unix Operating System
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS8 Debian
9 Ubuntu
10 openSUSE

然後我們就可以運用 sed 命令進行實驗了。

1. 刪除某一行

首先,我們先從刪除某一行開始,比如刪除第一行、最後一行,實際也就是第 N 行嘛。

刪除第 N 行的命令格式:

sed 'Nd' file
我們來刪除第一行試試:
# sed '1d' sed-demo.txt
After deletion:
2 Unix Operating System
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

很簡單是吧?這裡就不多作解釋了,你想要刪除第幾行的內容只需要把命令中的 1 替換一下就 ok 了。

那問題來了,最後一行用什麼數字表示呢?這裡給大家一個小提示,可以用美元符號 $ 表示最後,所以刪除最後一行的命令可以這麼寫:

# sed '$d' sed-demo.txt
After deletion:
1 Linux Operating System
2 Unix Operating System
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS
8 Debian
9 Ubuntu
2. 刪除某些行

sed 命令可以刪除連續又或者不連續的行內容。

刪除連續的行,例如刪除從 5 到 7 行 的內容:

# sed '5,7d' sed-demo.txt
After deletion:
1 Linux Operating System
2 Unix Operating System
3 RHEL
4 Red Hat
8 Debian
9 Ubuntu
10 openSUSE

刪除不連續的行,例如刪除第 1 、第 5 、第 9 和最後一行:

# sed '1d;5d;9d;$d' sed-demo.txt
After deletion:
2 Unix Operating System
3 RHEL
4 Red Hat
6 Arch Linux
7 CentOS
8 Debian

另外,它還可以配合邏輯非 ! 使用,比如刪除第 3到 6 行以外的其他行:

# sed '3,6!d' sed-demo.txt
After deletion:
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
3. 刪除空白行

sed 還支援刪除檔案的空白行,命令如下:

# sed '/^$/d' sed-demo.txt
After deletion:
1 Linux Operating System
2 Unix Operating System
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

提示:這裡兩個斜槓 / / 內的表示式起到了文字匹配的作用,大家可以參考正規表示式的使用方法。下面將列舉一些常用的方法來加深大家的學習。

4. 刪除包含特定字元的行

假設我們想要刪除示例檔案中的包含 System 這個單詞的行內容,我們可以用 /System/,它表示有出現 System 這個字串就進行匹配,具體的命令如下:

# sed '/System/d' sed-demo.txt
After deletion:
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

不僅如此,我們還可以加上一下邏輯條件,比方說下面的命令:

# sed '/System\|Linux/d' sed-demo.txt
After deletion:
3 RHEL
4 Red Hat
5 Fedora
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

符號 \| 代表邏輯或,上述命令的意思是文字中有 System 或 Linux 的行都要進行刪除。

5. 刪除特定字元開頭的行

首先,我們建立另一個示例檔案 sed-demo-1.txt 進行更好地演示,其內容如下:

# cat sed-demo-1.txt
After deletion:
Linux Operating System
Unix Operating System
RHEL
Red Hat
Fedora
debian
ubuntu
Arch Linux - 1
2 - Manjaro
3 4 5 6

上面也已經提到過,$ 號可以理解為結尾,那麼有沒有字元可以代表開頭呢?答案是有的,這裡我們可以用 ^ 號代表開頭。

那麼,我們想要刪除以某一個字元開頭的行時,比如說刪除以 R 開頭的行,可以使用如下命令:

# sed '/^R/d' sed-demo-1.txt
After deletion:
Linux Operating System
Unix Operating System
Fedora
debian
ubuntu
Arch Linux - 1
2 - Manjaro
3 4 5 6

那麼問題來了,比如我想刪除以 R 或者 F 開頭的行,那我是不是要執行兩次命令呢?如果是有更多豈不是要執行多次命令?這裡它有一個簡單的寫法,你只要把這些字元寫在一對中括號 [] 裡就可以了:

# sed '/^[RF]/d' sed-demo-1.txt
After deletion:
Linux Operating System
Unix Operating System
debian
ubuntu
Arch Linux - 1
2 - Manjaro
3 4 5 6

上面命令的作用是 刪除以 R 或者 F 開頭的行。

6. 刪除特定字元結尾的行

同上面一個道理,刪除以某一個字元結尾的行,比方說刪除以 m 結尾的行,我們可以這樣做:

# sed '/m$/d' sed-demo.txt
After deletion:
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

刪除以 x 或 m 結尾的行可以這樣寫:

# sed '/[xm]$/d' sed-demo.txt
After deletion:
3 RHEL
4 Red Hat
5 Fedora
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE
7. 刪除以大寫字母開頭的行

這裡問題又來了,我想要刪除所有以大寫字母開頭的行呢?按照上面的做法是不是要將 A 到 Z 這 26 個字母都寫進 [ ] 裡呢?其實我們大可不必這樣做,在 A 和 Z 中間加個 - 就可以了:

# sed '/^[A-Z]/d' sed-demo-1.txt
After deletion:
debian
ubuntu
2 - Manjaro
3 4 5 6
機智的你看到這裡肯定會想到其他類似的用法的了,不妨看看下面是否有你想到的命令吧。
8. 刪除包含字母字元的行
# sed '/[A-Za-z]/d' sed-demo-1.txt
After deletion:
3 4 5 6
9. 刪除包含數字的行
# sed '/[0-9]/d' sed-demo-1.txt
After deletion:
Linux Operating System
Unix Operating System
RHEL
Red Hat
Fedora
debian
ubuntu

另外,透過這個例子,我們可以加上 ^ 和 $ 更好地看到他們三個之間的區別:

# sed '/^[0-9]/d' sed-demo-1.txt
After deletion:
Linux Operating System
Unix Operating System
RHEL
Red Hat
Fedora
debian
ubuntu
Arch Linux - 1
# sed '/[0-9]$/d' sed-demo-1.txt
After deletion:
Linux Operating System
Unix Operating System
RHEL
Red Hat
Fedora
debian
ubuntu
2 - Manjaro
10. 其他更多

實際上,我們要刪除的檔案內容是更為具體的,簡單的條件是滿足不了我們的需求的,所以,sed 也支援更復雜的條件組合。比方說我要指定刪除在 1 到 6 行內有 Linux 這個詞的內容,那麼:

# sed '1,6{/Linux/d;}' sed-demo.txt
After deletion:
2 Unix Operating System
3 RHEL
4 Red Hat
5 Fedora
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

刪除包含 System 以及其下一行的內容:

# sed '/System/{N;d;}' sed-demo.txt
After deletion:
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

原文地址:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31559985/viewspace-2717485/,如需轉載,請註明出處,否則將追究法律責任。

相關文章