Linux文字處理命令(轉)
Linux文字處理命令(轉)[@more@] Sort命令
sort命令的功能是對檔案中的各行進行排序。sort命令有許多非常實用的選項,這些選項最初是用來對資料庫格式的檔案內容進行各種排序操作的。實際上,sort命令可以被認為是一個非常強大的資料管理工具,用來管理內容類似資料庫記錄的檔案。
Sort命令將逐行對檔案中的內容進行排序,如果兩行的首字元相同,該命令將繼續比較這兩行的下一字元,如果還相同,將繼續進行比較。
語法:
sort [選項] 檔案
說明:sort命令對指定檔案中所有的行進行排序,並將結果顯示在標準輸出上。如不指定輸入檔案或使用“- ”,則表示排序內容來自標準輸入。
sort排序是根據從輸入行抽取的一個或多個關鍵字進行比較來完成的。排序關鍵字定義了用來排序的最小的字元序列。預設情況下以整行為關鍵字按ASCII字元順序進行排序。
改變預設設定的選項主要有:
- m 若給定檔案已排好序,合併檔案。
- c 檢查給定檔案是否已排好序,如果它們沒有都排好序,則列印一個出錯資訊,並以狀態值1退出。
- u 對排序後認為相同的行只留其中一行。
- o 輸出檔案 將排序輸出寫到輸出檔案中而不是標準輸出,如果輸出檔案是輸入檔案之一,sort先將該檔案的內容寫入一個臨時檔案,然後再排序和寫輸出結果。
改變預設排序規則的選項主要有:
- d 按字典順序排序,比較時僅字母、數字、空格和製表符有意義。
- f 將小寫字母與大寫字母同等對待。
- I 忽略非列印字元。
- M 作為月份比較:“JAN”result
以第2個欄位作為排序關鍵字對檔案example的內容進行排序。
$ sort +1-2 example
對於file1和file2檔案內容反向排序,結果放在outfile中,利用第2個欄位的第一個字元作為排序關鍵字。
$ sort -r -o outfile +1.0 -1.1 example
sort排序常用於在管道中與其他命令連用,組合完成比較複雜的功能,如利用管道將當前工作目錄中的檔案送給sort進行排序,排序關鍵字是第6個至第8個欄位。
$ ls - l | sort +5 - 7
sort命令也可以對標準輸入進行操作。例如,如果您想把幾個檔案文字行合併,並對合並後的文字行進行排序,您可以首先用命令cat把多個檔案合併,然後用管道操作把合併後的文字行輸入給命令sort,sort命令將輸出這些合併及排序後的文字行。在下面的例子中,檔案veglist與檔案fruitlist的文字行經過合併與排序後被儲存到檔案clist中。
$ cat veglist fruitlist | sort > clist
uniq命令
檔案經過處理後在它的輸出檔案中可能會出現重複的行。例如,使用cat命令將兩個檔案合併後,再使用sort命令進行排序,就可能出現重複行。這時可以使用uniq命令將這些重複行從輸出檔案中刪除,只留下每條記錄的唯一樣本。
語法:
uniq [選項] 檔案
說明:這個命令讀取輸入檔案,並比較相鄰的行。在正常情況下,第二個及以後更多個重複行將被刪去,行比較是根據所用字符集的排序序列進行的。該命令加工後的結果寫到輸出檔案中。輸入檔案和輸出檔案必須不同。如果輸入檔案用“- ”表示,則從標準輸入讀取。
該命令各選項含義如下:
- c 顯示輸出中,在每行行首加上本行在檔案中出現的次數。它可取代- u和- d選項。
- d 只顯示重複行。
- u 只顯示檔案中不重複的各行。
- n 前n個欄位與每個欄位前的空白一起被忽略。一個欄位是一個非空格、非製表符的字串,彼此由製表符和空格隔開(欄位從0開始編號)。
+n 前n個字元被忽略,之前的字元被跳過(字元從0開始編號)。
- f n 與- n相同,這裡n是欄位數。
- s n 與+n相同,這裡n是字元數。
例如:
1. 顯示檔案example中不重複的行。
uniq - u example
2. 顯示檔案example中不重複的行,從第2個欄位的第2個字元開始做比較。
uniq - u - 1 +1 example
sort命令的功能是對檔案中的各行進行排序。sort命令有許多非常實用的選項,這些選項最初是用來對資料庫格式的檔案內容進行各種排序操作的。實際上,sort命令可以被認為是一個非常強大的資料管理工具,用來管理內容類似資料庫記錄的檔案。
Sort命令將逐行對檔案中的內容進行排序,如果兩行的首字元相同,該命令將繼續比較這兩行的下一字元,如果還相同,將繼續進行比較。
語法:
sort [選項] 檔案
說明:sort命令對指定檔案中所有的行進行排序,並將結果顯示在標準輸出上。如不指定輸入檔案或使用“- ”,則表示排序內容來自標準輸入。
sort排序是根據從輸入行抽取的一個或多個關鍵字進行比較來完成的。排序關鍵字定義了用來排序的最小的字元序列。預設情況下以整行為關鍵字按ASCII字元順序進行排序。
改變預設設定的選項主要有:
- m 若給定檔案已排好序,合併檔案。
- c 檢查給定檔案是否已排好序,如果它們沒有都排好序,則列印一個出錯資訊,並以狀態值1退出。
- u 對排序後認為相同的行只留其中一行。
- o 輸出檔案 將排序輸出寫到輸出檔案中而不是標準輸出,如果輸出檔案是輸入檔案之一,sort先將該檔案的內容寫入一個臨時檔案,然後再排序和寫輸出結果。
改變預設排序規則的選項主要有:
- d 按字典順序排序,比較時僅字母、數字、空格和製表符有意義。
- f 將小寫字母與大寫字母同等對待。
- I 忽略非列印字元。
- M 作為月份比較:“JAN”result
以第2個欄位作為排序關鍵字對檔案example的內容進行排序。
$ sort +1-2 example
對於file1和file2檔案內容反向排序,結果放在outfile中,利用第2個欄位的第一個字元作為排序關鍵字。
$ sort -r -o outfile +1.0 -1.1 example
sort排序常用於在管道中與其他命令連用,組合完成比較複雜的功能,如利用管道將當前工作目錄中的檔案送給sort進行排序,排序關鍵字是第6個至第8個欄位。
$ ls - l | sort +5 - 7
sort命令也可以對標準輸入進行操作。例如,如果您想把幾個檔案文字行合併,並對合並後的文字行進行排序,您可以首先用命令cat把多個檔案合併,然後用管道操作把合併後的文字行輸入給命令sort,sort命令將輸出這些合併及排序後的文字行。在下面的例子中,檔案veglist與檔案fruitlist的文字行經過合併與排序後被儲存到檔案clist中。
$ cat veglist fruitlist | sort > clist
uniq命令
檔案經過處理後在它的輸出檔案中可能會出現重複的行。例如,使用cat命令將兩個檔案合併後,再使用sort命令進行排序,就可能出現重複行。這時可以使用uniq命令將這些重複行從輸出檔案中刪除,只留下每條記錄的唯一樣本。
語法:
uniq [選項] 檔案
說明:這個命令讀取輸入檔案,並比較相鄰的行。在正常情況下,第二個及以後更多個重複行將被刪去,行比較是根據所用字符集的排序序列進行的。該命令加工後的結果寫到輸出檔案中。輸入檔案和輸出檔案必須不同。如果輸入檔案用“- ”表示,則從標準輸入讀取。
該命令各選項含義如下:
- c 顯示輸出中,在每行行首加上本行在檔案中出現的次數。它可取代- u和- d選項。
- d 只顯示重複行。
- u 只顯示檔案中不重複的各行。
- n 前n個欄位與每個欄位前的空白一起被忽略。一個欄位是一個非空格、非製表符的字串,彼此由製表符和空格隔開(欄位從0開始編號)。
+n 前n個字元被忽略,之前的字元被跳過(字元從0開始編號)。
- f n 與- n相同,這裡n是欄位數。
- s n 與+n相同,這裡n是字元數。
例如:
1. 顯示檔案example中不重複的行。
uniq - u example
2. 顯示檔案example中不重複的行,從第2個欄位的第2個字元開始做比較。
uniq - u - 1 +1 example
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10617542/viewspace-944460/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Linux文字處理命令Linux
- linux下的文字處理命令sedLinux
- LINUX學習(五)Linux文字處理命令Linux
- Linux文字處理命令sed基本使用示例Linux
- 10 文字分析處理命令
- Linux Shell程式設計(23)——文字處理命令Linux程式設計
- 程式設計小技巧之 Linux 文字處理命令(二)程式設計Linux
- Linux中文字處理命令sed的使用示例分享Linux
- 命令列與Shell -> 文字處理命令之sed命令列
- Linux文字處理技巧分享Linux
- LINUX系統 利用AWK命令處理文字資料過程Linux
- 幾個與文字處理相關的Linux命令總結Linux
- Linux:管道命令與文字處理三劍客(grep、sed、awk)Linux
- Linux文字處理詳細教程Linux
- Linux學習之檔案處理命令(二)目錄處理命令 && 檔案處理命令Linux
- Linux必學60個命令檔案處理(轉)Linux
- 使用 Linux/Unix 進行文字處理Linux
- Linux文字分段裁剪命令cut(轉)Linux
- [Linux]字元處理相關命令Linux字元
- Linux學習之檔案處理命令(一) 目錄處理命令lsLinux
- Linux檔案管理知識:文字處理Linux
- 詳解Bash命令列處理(轉)命令列
- 文字處理流編輯器sed命令用法大全
- 實用處理字串的linux命令字串Linux
- Linux基礎命令---文字格式轉換fmtLinux
- Linux基礎命令—文字格式轉換fmtLinux
- linux bible 處理器(轉)Linux
- 在 Linux/Unix 中文字處理方式總結Linux
- 預處理命令
- 批處理命令
- python 文字處理操作Python
- 簡單的文字處理
- 文字處理的有關
- 11.9Linux檔案管理知識:文字處理Linux
- linux處理oracle問題常用命令LinuxOracle
- linux入門必學檔案處理命令Linux
- 常用的 Linux 目錄處理命令總結Linux
- Linux 10字串命令病毒的處理記錄Linux字串