11.9Linux檔案管理知識:文字處理

大雄45發表於2023-11-03

11.9Linux檔案管理知識:文字處理

眾所周知,所有 Linux 作業系統 都離不開一個核心原則,那就是它是由很多種檔案組成的,那麼, Linux 系統的任何操作就離不開文字檔案的處理。所以,它有很多命令工具用來處理文字的。在這篇文章中我們主要介紹下用於文字格式化輸出及其它常用的命令工具。

常見的命令工具如下:

命令(工具)名稱

描述

cat

用於連線檔案並且列印到標準輸出

sort

用於給文字行排序

uniq

用於報告或者省略重複行

cut

用於從每行中刪除文字區域

paste

用於合併檔案文字行

join

用於基於某個共享欄位來聯合兩個檔案的文字行

comm

用於逐行比較兩個有序的檔案

diff

用於逐行比較檔案

patch

用於給原始檔案打補丁

tr

用於翻譯或刪除字元

sed

用於篩選和轉換文字的流編輯器

aspell

用於互動式拼寫檢查器

接下來,我們先回顧下 Linux 系統文字處理工具。

Linux 文字處理工具

說到 Linux 文字處理工具或者程式,我相信大家首先提到就是 vim 了。是的,沒錯!但是文字還可以用來做什麼呢?這個值得大家思考!

在這裡列舉一些用途:

²  透過純文字格式形式編寫文件;

²  另一種文字文件格式就是 網頁 ,目前最常見的就是透過 超文字標 記語言 HTML 可擴充套件的標記語言XML 作為標記語言 來實現的;

²  基於文字的電子郵件 email

²  純文字格式 格式化 輸出

²  軟體開發 裡的 程式原始碼 .

cat-A 命令 程式

cat-A 命令 程式, 可將 文字非列印字元 (比如說控制字元 tab 、空格、回車字元等)顯示出來

例項 1

第一步:建立測試檔案或者例項

[ root @linuxprobe ~]$ cat > test 1.txt

T he food is delicious.     

[ root @linuxprobe ~]$

備註:

建立測試檔案 test 1 . txt ,輸入 cat 命令指定了用於重定向輸出的檔案 test 1 . txt ,隨後輸入文字內容 T he    ”,最後回車 Enter ;使用 Ctrl+D 組合鍵 指示cat 命令。

需要注意的是測試檔案 test 1 . txt 文字內容的開頭和末尾分別使用了一個 tab 字元以及一些空格。

第二步:剛剛建立的測試檔案 test 1.txt 文字 內容透過 cat -A 命令顯示 出來

[ root @linuxprobe ~]$ cat -A test 1.txt

^IThe food is delicious.. $

[ root @linuxprobe ~]$

結論:

在輸出的顯示結果中我們可以分析:

文字中的 tab 字元由 ˆI 字元來 顯示出來

文字末尾的空格 $ 字元來 顯示出來。

例項 2

第一步:建立測試檔案或者例項

[root@linuxprobe ~]$ cat > test2.txt

It tastes delicious,

 

 

and makes one run at the mouth.     

[root@linuxprobe ~]$

[root@linuxprobe ~]$ cat - ns         // -n 給文字行新增行號

-s :禁止輸出多個空白行

1 It tastes delicious,

2

3 and makes one run at the mouth.

[root@linuxprobe ~]$

備註:

重新建立了一個新的測試檔案 test2.txt, 文字 內容為 It tastes delicious,

and makes one run at the mouth. 由兩個空白 行區分開。經過 cat -ns 命令 程式 執行處理( 給文字行新增行號 ,並將 禁止輸出多個空白行 輸出)輸出顯示出來。

sort 命令 程式

sort 命令 程式 針對指定的文字 內容或命令列中指定的一個或多個 內容 進行排序, 並將 排序結 果標準輸出顯示出來。

sort 程式來處理標準輸 入例項:

[ root @linuxprobe ~]$ sort test 3.txt

2

3

1

[ root @linuxprobe ~]$ ccat   test 3.txt

test1.txt test2.txt test3.txt 三個文字檔案合併為一個有序的檔案 sorted _ test _list.txt

Sort 命令 程式 的常見 選項 引數如下表:  

選項

長選項

描述

-b

--ignore-leading-blanks

預設情況下,對整行進行排序,從每行的第一個字元開始。這個選項導致 sort 程式忽略每行開頭的空格,從第一個非空白字元開始排序。

-f

--ignore-case

讓排序不區分大小寫。

-n

--numeric-sort

基於字串的數值來排序。使用此選項允許根據數字值執行排序,而不是字母值。

-r

--reverse

按相反順序排序。結果按照降序排列,而不是升序。

-k

--key=field1[,field2]

對從 field1 到field2 之間的字元排序,而不是整個文字行。看下面的討論。

-m

--merge

把每個引數看作是一個預先排好序的檔案。把多個檔案合併成一個排好序的檔案,而沒有執行額外的排序。

-o

--output=file

把排好序的輸出結果傳送到檔案,而不是標準輸出。

-t

--field-separator=char

定義域分隔字元。預設情況下,域由空格或製表符分隔。

 

這篇文章主要介紹了 cat及sort命令程式,它們是如何被用來執行文字處理操作的。

L inux系統知識博大精深, 所以 我在此 強烈建議大家可以參考下 這本書,對於linux系統 文字處理 層面的介紹很詳細! 那麼關於 Linux系統中文字處理 命令 操作及運用 介紹 先告一段落了,後期文章會一一補發。

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69955379/viewspace-2992664/,如需轉載,請註明出處,否則將追究法律責任。

相關文章