文字處理流編輯器sed命令用法大全

chenfeng發表於2015-12-19

sed是一種流編輯器,它是文字處理中非常中的工具,能夠完美的配合正規表示式使用,功能不同凡響。處理時,把當前處理的行儲存在臨時緩衝區中,稱為“模式空間”(pattern space),接著用sed命令處理緩衝區中的內容,處理完成後,把緩衝區的內容送往螢幕。接著處理下一行,這樣不斷重複,直到檔案末尾。檔案內容並沒有 改變,除非你使用重定向儲存輸出。Sed主要用來自動編輯一個或多個檔案;簡化對檔案的反覆操作;編寫轉換程式等。

1. sed的選項、命令、替換標記

 

1.1 sed命令格式


1.2 sed選項

  1. -e 以選項中指定的script來處理輸入的文字檔案;
  2. -f 以選項中指定的script檔案來處理輸入的文字檔案;
  3. -i 直接修改讀取的檔案內容;
  4. -n 安靜模式,僅顯示處理後的結果;

1.3 sed命令

  1. a\ 在當前行下面插入文字。
  2. i\ 在當前行上面插入文字。
  3. c\ 把選定的行改為新的文字。
  4. d 刪除,刪除選擇的行。
  5. D 刪除模板塊的第一行。
  6. s 替換指定字元
  7. h 複製模板塊的內容到記憶體中的緩衝區。
  8. H 追加模板塊的內容到記憶體中的緩衝區。
  9. g 獲得記憶體緩衝區的內容,並替代當前模板塊中的文字。
  10. G 獲得記憶體緩衝區的內容,並追加到當前模板塊文字的後面。
  11. l 列表不能列印字元的清單。
  12. n 讀取下一個輸入行,用下一個命令處理新的行而不是用第一個命令。
  13. N 追加下一個輸入行到模板塊後面並在二者間嵌入一個新行,改變當前行號碼。
  14. p 列印模板塊的行。
  15. P(大寫) 列印模板塊的第一行。
  16. q 退出Sed。
  17. b lable 分支到指令碼中帶有標記的地方,如果分支不存在則分支到指令碼的末尾。
  18. r file 從file中讀行。
  19. t label if分支,從最後一行開始,條件一旦滿足或者T,t命令,將導致分支到帶有標號的命令處,或者到指令碼的末尾。
  20. T label 錯誤分支,從最後一行開始,一旦發生錯誤或者T,t命令,將導致分支到帶有標號的命令處,或者到指令碼的末尾。
  21. w file 寫並追加模板塊到file末尾。
  22. W file 寫並追加模板塊的第一行到file末尾。
  23. ! 表示後面的命令對所有沒有被選定的行發生作用。
  24. = 列印當前行號碼。
  25. # 把註釋擴充套件到下一個換行符以前。

1.4 sed替換標記

  1. g 表示行內全面替換。
  2. p 表示列印行。
  3. w 表示把行寫入一個檔案。
  4. x 表示互換模板塊中的文字和緩衝區中的文字。
  5. y 表示把一個字元翻譯為另外的字元(但是不用於正規表示式)
  6. \1 子串匹配標記
  7. & 已匹配字串標記

1.5 sed元字符集

  1. ^ 匹配行開始,如:/^sed/匹配所有以sed開頭的行。
  2. $ 匹配行結束,如:/sed$/匹配所有以sed結尾的行。
  3. . 匹配一個非換行符的任意字元,如:/s.d/匹配s後接一個任意字元,最後是d。
  4. * 匹配0個或多個字元,如:/*sed/匹配所有模板是一個或多個空格後緊跟sed的行。
  5. [] 匹配一個指定範圍內的字元,如/[Ss]ed/匹配sed和Sed。
  6. [^] 匹配一個不在指定範圍內的字元,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一個字母開頭,緊跟ed的行。
  7. \(..\) 匹配子串,儲存匹配的字元,如s/\(love\)able/\1rs,loveable被替換成lovers。
  8. & 儲存搜尋字元用來替換其他字元,如s/love/**&**/,love這成**love**。
  9. \< 匹配單詞的開始,如:/\<love/匹配包含以love開頭的單詞的行。
  10. \> 匹配單詞的結束,如/love\>/匹配包含以love結尾的單詞的行。
  11. x\{m\} 重複字元x,m次,如:/0\{5\}/匹配包含5個0的行。
  12. x\{m,\} 重複字元x,至少m次,如:/0\{5,\}/匹配至少有5個0的行。
  13. x\{m,n\} 重複字元x,至少m次,不多於n次,如:/0\{5,10\}/匹配5~10個0的行。

2. sed用法例項

 

2.1 替換操作:s命令

替換文字中的字串:

-n選項p命令一起使用表示只列印那些發生替換的行:

直接編輯檔案選項-i,會匹配file檔案中每一行的第一個book替換為books:


2.2 全面替換標記g

使用字尾 /g 標記會替換每一行中的所有匹配:

當需要從第N處匹配開始替換時,可以使用 /Ng:


2.3 定界符

以上命令中字元 / 在sed中作為定界符使用,也可以使用任意的定界符:

定界符出現在樣式內部時,需要進行轉義:


2.4 刪除操作:d命令

刪除空白行:

刪除檔案的第2行:

刪除檔案的第2行到末尾所有行:

刪除檔案最後一行:

刪除檔案中所有開頭是test的行:


2.5 已匹配字串標記&

正規表示式 \w\+ 匹配每一個單詞,使用 [&] 替換它,& 對應於之前所匹配到的單詞:

所有以192.168.0.1開頭的行都會被替換成它自已加localhost:


<h3 id="子串匹配標記 2.6 子串匹配標記\1

匹配給定樣式的其中一部分:

命令中 digit 7,被替換成了 7。樣式匹配到的子串是 7,\(..\) 用於匹配子串,對於匹配到的第一個子串就標記為 \1,依此類推匹配到的第二個結果就是\2,例如:

love被標記為1,所有loveable會被替換成lovers,並列印出來:


2.7 組合多個表示式



2.8 引用

sed表示式可以使用單引號來引用,但是如果表示式內部包含變數字串,就需要使用雙引號。


2.9 選定行的範圍:,(逗號)

所有在模板test和check所確定的範圍內的行都被列印:

列印從第5行開始到第一個包含以test開始的行之間的所有行:

對於模板test和west之間的行,每行的末尾用字串aaa bbb替換:


2.10 多點編輯:e命令

-e選項允許在同一行裡執行多條命令:

上面sed表示式的第一條命令刪除1至5行,第二條命令用check替換test。命令的執行順序對結果有影響。如果兩個命令都是替換命令,那麼第一個替換命令將影響第二個替換命令的結果。

和 -e 等價的命令是 --expression:


2.11 從檔案讀入:r命令

file裡的內容被讀進來,顯示在與test匹配的行後面,如果匹配多行,則file的內容將顯示在所有匹配行的下面:


2.12 寫入檔案:w命令

在example中所有包含test的行都被寫入file裡:


2.13 追加(行下):a\命令

將 this is a test line 追加到 以test 開頭的行後面:

在 test.conf 檔案第2行之後插入 this is a test line:


2.14 插入(行上):i\命令

將 this is a test line 追加到以test開頭的行前面:

在test.conf檔案第5行之前插入this is a test line:


2.15 下一個:n命令

如果test被匹配,則移動到匹配行的下一行,替換這一行的aa,變為bb,並列印該行,然後繼續:


2.16 變形:y命令

把1~10行內所有abcde轉變為大寫,注意,正規表示式元字元不能使用這個命令:


2.17 退出:q命令

列印完第10行後,退出sed


2.18 保持和獲取:h命令和G命令

在sed處理檔案的時候,每一行都被儲存在一個叫模式空間的臨時緩衝區中,除非行被刪除或者輸出被取消,否則所有被處理的行都將 列印在螢幕上。接著模式空間被清空,並存入新的一行等待處理。

在這個例子裡,匹配test的行被找到後,將存入模式空間,h命令將其複製並存入一個稱為保持快取區的特殊緩衝區內。第二條語句的意思是,當到達最後一行後,G命令取出保持緩衝區的行,然後把它放回模式空間中,且追加到現在已經存在於模式空間中的行的末尾。在這個例子中就是追加到最後一行。簡單來說,任何包含test的行都被複制並追加到該檔案的末尾。

2.19 保持和互換:h命令和x命令

互換模式空間和保持緩衝區的內容。也就是把包含test與check的行互換:


2.20 指令碼scriptfile

sed指令碼是一個sed的命令清單,啟動Sed時以-f選項引導指令碼檔名。Sed對於指令碼中輸入的命令非常挑剔,在命令的末尾不能有任何空白或文字,如果在一行中有多個命令,要用分號分隔。以#開頭的行為註釋行,且不能跨行。


2.21 列印奇數行或偶數行

方法1:

方法2:


2.22 列印匹配字串的下一行


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/15498/viewspace-1875073/,如需轉載,請註明出處,否則將追究法律責任。

相關文章