shell中grep命令詳解

SaiW-n_n-發表於2017-05-20

簡介:

Linux系統中grep命令是一種強大的文字搜尋工具,它能使用正規表示式搜尋文字,並把匹 配的行列印出來。grep全稱是Global Regular Expression Print,表示全域性正規表示式版本,它的使用許可權是所有使用者。

基本格式:

grep pattern [file...]
(1)grep 搜尋字串 [filename]
(2)grep 正規表示式 [filename]
在檔案中搜尋所有 pattern 出現的位置, pattern 既可以是要搜尋的字串,也可以是一個正規表示式.
注意:在輸入要搜尋的字串時最好使用雙引號;而在模式匹配使用正規表示式時,注意使用單引號。

主要引數:

[options]主要引數:
-c:列印匹配行的計數。
-i:忽略大小寫
-h:查詢多檔案時不顯示檔名。
-l:查詢多檔案時只輸出包含匹配字元的檔名。
-n:顯示匹配行及 行號。
-s:不顯示不存在或無匹配文字的錯誤資訊。
-v:顯示不包含匹配文字的所有行。
pattern正規表示式主要引數:
\    :忽略正規表示式中特殊字元的原有含義 
^   :匹配正規表示式的開始行 
$   :匹配正規表示式的結束行 
\<  :從匹配正規表示式的行開始 
\>  : 到匹配正規表示式的行結束 
[ ]  :單個字元;如[A] 即A符合要求 
[ - ]: 範圍 ;如[A-Z]即A,B,C一直到Z都符合要求 
.    :所有的單個字元 
*   :所有字元,長度可以為0 

用‘grep’搜尋文字檔案:

如果您要在幾個文字檔案中查詢一字串,可以使用‘grep’命令。‘grep’在文字中搜尋指定的字串。舉個例子:假設您正在‘/usr/src/linux/Documentation’目錄下搜尋帶字串‘magic’的檔案:
$ grep magic /usr/src/linux/Documentation/*
sysrq.txt:* How do I enable the magic SysRQ key?
sysrq.txt:* How do I use the magic SysRQ key?

其中檔案‘sysrp.txt’包含該字串,討論的是 SysRQ 的功能。

預設情況下,‘grep’只搜尋當前目錄
。如果此目錄下有許多子目錄,‘grep’會以如下形式列出:
grep: sound: Is a directory
這可能會使‘grep’的輸出難於閱讀。這裡有兩種解決的辦法:
明確要求搜尋子目錄:grep -r
忽略子目錄:grep -d skip

當然,如果預料到有許多輸出,您可以通過 管道
將其轉到‘less’上閱讀:
$ grep magic /usr/src/Linux/Documentation/* | less

這樣,您就可以更方便地閱讀。


有一點要注意,您必需提供一個檔案過濾方式(搜尋全部檔案的話用*)。如果您忘了,‘grep’會一直等著,直到該程式被中斷。如果您遇到了這樣的情況,按ctrl+c,然後再試。important!!


下面是一些有意思的命令列引數
grep -i pattern files:不區分大小寫地搜尋。預設情況區分大小寫,
grep -l pattern files :只列出匹配的檔名,
grep -L pattern files :列出不匹配的檔名,
grep -w pattern files:只匹配整個單詞,而不是字串的一部分(如匹配‘magic’,而不是‘magical’),
grep -C number pattern files:匹配的上下文分別顯示[number]行,
grep pattern1 | pattern2 files :顯示匹配 pattern1 或 pattern2的行,
grep pattern1 files grep pattern2 :顯示既匹配 pattern1 又匹配pattern2 的行。

這裡還有些用於搜尋的特殊符號
\< 和 \> 分別標註單詞的開始與結尾。 
例如: 
grep man * 會匹配 ‘Batman’、‘manic’、‘man’等, 
grep '\<man' * 匹配‘manic’和‘man’,但不是‘Batman’, 
grep '\<man\>' 只匹配‘man’,而不是‘Batman’或‘manic’等其他的字串。 

'^':指匹配的字串在行首, 
'$':指匹配的字串在行尾,

如果您不習慣命令列引數,可以試試圖形介面的‘grep’,如 reXgrep 。這個軟體提供 AND、OR、NOT 等語法,還有漂亮的按鈕 :-) 。如果您只是需要更清楚的輸出,不妨試試 fungrep 。

 

Grep的常用命令語法

1. 雙引號引用和單引號引用
在g r e p命令中輸入字串引數時,最好將其用雙引號括起來。例如:”m y s t r i n g”。這樣做有兩個原因,一是以防被誤解為 s h e l l命令,二是可以用來查詢多個單片語成的字串,例如:”jet plane”,如果不用雙引號將其括起來,那麼單詞 p l a n e將被誤認為是一個檔案,查詢結果將返回”檔案不存在”的錯誤資訊。
在呼叫變數時,也應該使用雙引號,諸如: g r e p”$ M Y VA R”檔名,如果不這樣,將
沒有返回結果。
在呼叫模式匹配時,應使用單引號.[root@mypc ]# echo `grep 123 111.txt`  (#注意是反單引號)


3. 特殊的–在多個檔案中進行查詢
$ grep “sort” *.doc     ( #在當前目錄下所有. d o c檔案中查詢字串”s o r t”)
 
$ grep “sort it” *      (#或在所有檔案中查詢單詞”sort it”)
接下來的所有示例是指在單個檔案中進行查詢
4. 行匹配
$ grep -c “48″ data.f
$ 4                      (#g r e p返回數字4,意義是有4行包含字串”4 8″。)
$ grep “48″ data.f          (#顯示包含”4 8″字串的4行文字)

5. 顯示滿足匹配模式的所有行行數:
[root@mypc oid2000]# grep -n 1234 111.txt
1:1234
3:1234ab

6. 精確匹配
[root@mypc oid2000]# grep “1234\>” 111.txt
1234

7. 查詢空行,查詢以某個條件開頭或者結尾的行。
結合使用^和$可查詢空行。使用- n引數顯示實際行數
[root@mypc oid2000]# grep -n “^$” 111.txt    (返回結果 2:   #說明第二行是空行)
[root@mypc oid2000]# grep -n “^abc” 111.txt (#查詢以abc開頭的行)
[root@mypc oid2000]# grep -n “abc$” 111.txt  (#查詢以abc結尾的行)

8. 匹配特殊字元,查詢有特殊含義的字元,諸如$ . ‘ ” * [] ^ | \ + ? ,必須在特定字元前加\。
[root@mypc oid2000]# grep  “\.” 111.txt  (#在111.txt中查詢包含”.”的所有行)
[root@mypc oid2000]# grep  “my\.conf”  111.txt (#查詢有檔名my. c o n f的行)

9. 目錄的查詢
[root@mypc oid2000]# ls -l |grep “^d”      (#如果要查詢目錄列表中的目錄)
[root@mypc oid2000]# ls -l |grep “^d[d]“    (#在一個目錄中查詢不包含目錄的所有檔案)
[root@mypc]# ls -l |grpe “^d…..x..x” (#查詢其他使用者和使用者組成員有可執行許可權的目錄集合)


正規表示式的應用

(1)正規表示式的應用 (注意:最好把正規表示式用單引號括起來)
    grep '[239].' data.doc      #輸出所有含有以2,3或9開頭的,並且是兩個數字的行

(2)不匹配測試
    grep '^[^48]' data.doc      #不匹配行首是48的行

(3)使用擴充套件模式匹配
    grep -E '219|216' data.doc

(4) ...
    這需要在實踐中不斷應用和總結,熟練掌握正規表示式。

5, 使用類名
可以使用國際模式匹配的類名:
[[:upper:]]   [A-Z]
[[:lower:]]   [a-z]
[[:digit:]]   [0-9]
[[:alnum:]]   [0-9a-zA-Z]
[[:space:]]   空格或tab
[[:alpha:]]   [a-zA-Z]

(1)使用
    grep '5[[:upper:]][[:upper:]]' data.doc     #查詢以5開頭以兩個大寫字母結尾的行

參考:

http://blog.csdn.net/dysh1985/article/details/7571273

http://blog.csdn.net/onlyou930/article/details/6582409

相關文章