Linux系統中grep命令是一種強大的文字搜尋工具,它能使用正規表示式搜尋文字,並把匹 配的行列印出來。grep全稱是Global Regular Expression Print,表示全域性正規表示式版本,它的使用許可權是所有使用者。
grep的工作方式是這樣的,它在一個或多個檔案中搜尋字串模板。如果模板包括空格,則必須被引用,模板後的所有字串被看作檔名。搜尋的結果被送到標準輸出,不影響原檔案內容。
grep可用於shell指令碼,因為grep通過返回一個狀態值來說明搜尋的狀態,如果模板搜尋成功,則返回0,如果搜尋不成功,則返回1,如果搜尋的檔案不存在,則返回2。我們利用這些返回值就可進行一些自動化的文字處理工作。
一.命令格式:
grep [-abcEFGhHilLnqrsvVwxy][-A<顯示列數>][-B<顯示列數>][-C<顯示列數>][-d<進行動作>][-e<範本樣式>][-f<範本檔案>][--help][範本樣式][檔案或目錄...]
二.命令功能:
用於過濾/搜尋的特定字元。可使用正規表示式能多種命令配合使用,使用上十分靈活。
三.命令引數:
引數 | 描述 |
---|---|
-a | 或 --text : 不要忽略二進位制的資料。 |
-A | 或 --after-context= : 除了顯示符合範本樣式的那一列之外,並顯示該行之後的內容。 |
-b | 或 --byte-offset : 在顯示符合樣式的那一行之前,標示出該行第一個字元的編號。 |
-B | 或 --before-context= : 除了顯示符合樣式的那一行之外,並顯示該行之前的內容。 |
-c | 或 --count : 計算符合樣式的列數。 |
-C | 或 --context=或- : 除了顯示符合樣式的那一行之外,並顯示該行之前後的內容。 |
-d | 或 --directories= : 當指定要查詢的是目錄而非檔案時,必須使用這項引數,否則grep指令將回報資訊並停止動作。 |
-e | 或 --regexp= : 指定字串做為查詢檔案內容的樣式。 |
-E | 或 --extended-regexp : 將樣式為延伸的普通表示法來使用。 |
-f 或 --file= : 指定規則檔案,其內容含有一個或多個規則樣式,讓grep查詢符合規則條件的檔案內容,格式為每行一個規則樣式。 | |
-F | 或 --fixed-regexp : 將樣式視為固定字串的列表。 |
-G | 或 --basic-regexp : 將樣式視為普通的表示法來使用。 |
-h | 或 --no-filename : 在顯示符合樣式的那一行之前,不標示該行所屬的檔名稱。 |
-H | 或 --with-filename : 在顯示符合樣式的那一行之前,表示該行所屬的檔名稱。 |
-i | 或 --ignore-case : 忽略字元大小寫的差別。 |
-l | 或 --file-with-matches : 列出檔案內容符合指定的樣式的檔名稱。 |
-L | 或 --files-without-match : 列出檔案內容不符合指定的樣式的檔名稱。 |
-n | 或 --line-number : 在顯示符合樣式的那一行之前,標示出該行的列數編號。 |
-q | 或 --quiet或--silent : 不顯示任何資訊。 |
-r | 或 --recursive : 此引數的效果和指定"-d recurse"引數相同。 |
-s | 或 --no-messages : 不顯示錯誤資訊。 |
-v | 或 --revert-match : 顯示不包含匹配文字的所有行。 |
-V | 或 --version : 顯示版本資訊。 |
-w | 或 --word-regexp : 只顯示全字元合的列。 |
-x | --line-regexp : 只顯示全列符合的列。 |
-y | 此引數的效果和指定"-i"引數相同。 |
四. 規則表示式
grep 的規則表示式
表示式 | 描述 |
---|---|
^ | 錨定行的開始 如:'^grep'匹配所有以grep開頭的行。 |
$ | 錨定行的結束 如:'grep$'匹配所有以grep結尾的行。 |
. | 匹配一個非換行符的字元 如:'gr.p'匹配gr後接一個任意字元,然後是p。 |
* | 匹配零個或多個先前字元 如:'*grep'匹配所有一個或多個空格後緊跟grep的行。 |
.* | 一起用代表任意字元。 |
[] | 匹配一個指定範圍內的字元,如'[Gg]rep'匹配Grep和grep。 |
[^] | 匹配一個不在指定範圍內的字元,如:'[^A-FH-Z]rep'匹配不包含A-F和H-Z的一個字母開頭,緊跟rep的行。 |
\(..) #標記匹配字元,如'(love)',love被標記為1。 | |
< | 錨定單詞的開始,如:'<grep'匹配包含以grep開頭的單詞的行。 |
> | 錨定單詞的結束,如'grep>'匹配包含以grep結尾的單詞的行。 |
x{m} | 重複字元x,m次,如:'0{5}'匹配包含5個o的行。 |
x{m,} | 重複字元x,至少m次,如:'o{5,}'匹配至少有5個o的行。 |
x{m,n} | 重複字元x,至少m次,不多於n次,如:'o{5,10}'匹配5--10個o的行。 |
\w | 匹配文字和數字字元,也就是[A-Za-z0-9],如:'G\w*p'匹配以G後跟零個或多個文字或數字字元,然後是p。 |
\W | \w的反置形式,匹配一個或多個非單詞字元,如點號句號等。 |
\b | 單詞鎖定符,如: '\bgrep\b'只匹配grep。 |
POSIX字元:
為了在不同國家的字元編碼中保持一至,POSIX(The Portable Operating System Interface)增加了特殊的字元類,如[:alnum:]是[A-Za-z0-9]的另一個寫法。要把它們放到[]號內才能成為正規表示式,如[A- Za-z0-9]或[[:alnum:]]。在linux下的grep除fgrep外,都支援POSIX的字元類。
字元 | 描述 |
---|---|
[:alnum:] | 文字數字字元 |
[:alpha:] | 文字字元 |
[:digit:] | 數字字元 |
[:graph:] | 非空字元(非空格、控制字元) |
[:lower:] | 小寫字元 |
[:cntrl:] | 控制字元 |
[:print:] | 非空字元(包括空格) |
[:punct:] | 標點符號 |
[:space:] | 所有空白字元(新行,空格,製表符) |
[:upper:] | 大寫字元 |
[:xdigit:] | 十六進位制數字(0-9,a-f,A-F) |
五. 使用例項
1. 查詢指定程式
命令:
ps -ef|grep uwsgi
輸出:
[root@localhost autoAweme]# ps -ef|grep uwsgi
root 30568 795 0 12月01 ? 00:00:23 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 30578 30568 0 12月01 ? 00:00:00 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 59379 795 1 12月04 ? 00:13:13 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 59406 59379 0 12月04 ? 00:00:03 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 112483 86053 0 09:29 pts/1 00:00:00 grep --color=auto uwsgi
說明:
除最後一條記錄外,其他的都是查詢出的程式;最後一條記錄結果是grep程式本身,並非真正要找的程式。
2. 查詢指定程式時,不顯示grep 本身程式
命令:
ps aux | grep uwsgi | grep -v "grep"
ps aux|grep [u]wsgi
ps aux|grep /[u]wsgi
輸出:
[root@localhost test]# ps -aux | grep uwsgi
root 30568 0.0 1.3 310244 53696 ? S 12月01 0:23 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 30578 0.0 1.2 310244 49556 ? S 12月01 0:00 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 59379 1.5 1.3 457952 50236 ? Sl 12月04 13:50 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 59406 0.0 1.3 467760 53104 ? S 12月04 0:03 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 87765 0.0 0.0 112704 1016 pts/1 R+ 10:14 0:00 grep --color=auto uwsgi
[root@localhost test]# ps -aux | grep uwsgi | grep -v "grep"
root 30568 0.0 1.3 310244 53696 ? S 12月01 0:23 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 30578 0.0 1.2 310244 49556 ? S 12月01 0:00 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 59379 1.5 1.3 457952 50236 ? Sl 12月04 13:50 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 59406 0.0 1.3 467760 53104 ? S 12月04 0:03 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
[root@localhost test]# ps -aux | grep [u]wsgi
root 30568 0.0 1.3 310244 53696 ? S 12月01 0:23 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 30578 0.0 1.2 310244 49556 ? S 12月01 0:00 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 59379 1.5 1.3 457952 50236 ? Sl 12月04 13:45 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 59406 0.0 1.3 467760 53104 ? S 12月04 0:03 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
[root@localhost test]# ps -aux | grep \[u]wsgi
root 30568 0.0 1.3 310244 53696 ? S 12月01 0:23 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 30578 0.0 1.2 310244 49556 ? S 12月01 0:00 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 59379 1.5 1.3 457952 50236 ? Sl 12月04 13:45 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 59406 0.0 1.3 467760 53104 ? S 12月04 0:03 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
3. 查詢指定程式個數
命令:
ps -ef|grep uwsgi -c
ps -ef|grep -c uwsgi
輸出:
[root@localhost autoAweme]# ps -ef|grep uwsgi -c
5
[root@localhost autoAweme]# ps -ef|grep -c uwsgi
5
4. 從檔案中讀取關鍵詞進行搜尋
命令:
cat 3.log | grep -f 4.log
輸出:
[root@localhost test]# cat 3.log
1
2
3
[root@localhost test]# cat 4.log
1
12
5
43
[root@localhost test]# cat 3.log | grep -f 4.log
1
[root@localhost test]# cat 4.log | grep -f 3.log
1
12
43
說明:
cat 3.log | grep -f 4.log 從3.log檔案中匹配出含有4.log中關鍵字的行並輸出
cat 4.log | grep -f 3.log 從4.log檔案中匹配出含有3.log中關鍵字的行並輸出
如:4.log中的關鍵字有1,12,5,43四個,在3.log中無論是完全匹配還是部分匹配只能匹配到1,並輸出
在 3.log中關鍵字為1,2,3, 所以在4.log中匹配3時,能完全匹配到含有1,2,3的行,並把匹配部分著色表示輸出
5. 從檔案中讀取關鍵詞進行搜尋 且顯示行號
命令:
cat 4.log | grep -nf 3.log
輸出:
[root@localhost test]# cat 4.log | grep -nf 3.log
1:1
2:12
4:43
[root@localhost test]# cat 3.log | grep -nf 4.log
1:1
說明:
輸出4.log檔案中含有從3.log 檔案中讀取出的關鍵詞的內容行,並顯示每一行的行號,冒號(:)左邊是行號,右邊是匹配的內容
6. 從檔案中查詢關鍵詞
命令:
grep "1" 4.log
輸出:
[root@localhost test]# cat 4.log
1
12
"1"
5
43
[root@localhost test]# grep 1 4.log
1
12
"1"
[root@localhost test]# grep '1' 4.log
1
12
"1"
[root@localhost test]# grep "1" 4.log
1
12
"1"
[root@localhost test]# grep \"1\" 4.log
"1"
說明:
有無引號,或者單雙引號 效果是一樣的,但是加上引號可讀性好一點。另外如果要查詢帶引號的內容,需要用\進行轉義
7. 從多個檔案中查詢關鍵詞
命令:
grep '1' 3.log 4.log
輸出:
[root@localhost test]# grep '1' 3.log 4.log
3.log:1
4.log:1
4.log:12
4.log:"1"
[root@localhost test]# grep -n 1 3.log 4.log
3.log:1:1
4.log:1:1
4.log:2:12
4.log:3:"1"
說明:
多檔案時,輸出查詢到的資訊內容行時,會把檔案的命名放在在行的最左邊輸出並且加上":"作為標示符分隔,如果用了-n展示行號,則第二個:的左邊是行號,最右邊的是匹配內容
8.找出以1開頭的行內容
命令:
cat 4.log |grep ^1
輸出:
[root@localhost test]# cat 4.log
1
12
"1"
5
43
[root@localhost test]# cat 4.log |grep ^1
1
12
9.找出非1開頭的行內容
命令:
cat 4.log |grep ^[^1]
輸出:
[root@localhost test]# cat 4.log |grep ^[^1]
"1"
5
43
10.找出以3結尾的行內容
命令:
cat 4.log |grep 3$
輸出:
[root@localhost test]# cat 4.log |grep 3$
43
11.在當前目錄中,查詢字尾有 log 字樣的檔案中包含 1 字串的檔案,並列印出該字串的行
命令:
grep 1 *log
輸出:
[root@localhost test]# ls
1.log 2.log 2.log.back 3.log 4.log
[root@localhost test]# grep 1 *log
3.log:1
4.log:1
4.log:12
4.log:"1"
12 . 以遞迴的方式查詢符合條件的檔案
命令:
grep -r 僅此一條 /home/hc
輸出:
[root@localhost hc]# grep -r 僅此一條 /home/hc
/home/hc/test/2.log.back:僅此一條,我是第五行
[root@localhost hc]#
說明:
查詢指定目錄/home/hc 及其子目錄(如果存在子目錄的話)下所有檔案中包含字串"僅此一條"的檔案,並列印出該字串所在行的內容
13.反向查詢
命令:
grep -v 僅此一條 *
輸出:
[root@localhost test]# ls
1.log 2.log 2.log.back 3.log 4.log
[root@localhost test]# grep 僅此一條 *
2.log.back:僅此一條,我是第五行
[root@localhost test]# grep -v 僅此一條 *
1.log:hnlinux
1.log:
1.log:hpython.cn
1.log:
1.log:ubuntu
1.log:
1.log:ubuntu linux
1.log:
1.log:redhat
1.log:
1.log:Redhat
1.log:
1.log:linuxmint
2.log:linux
2.log:
2.log:Redhat
2.log.back:第一行
2.log.back:第二行
2.log.back:我是log2第3行
2.log.back:第四行
3.log:1
3.log:2
3.log:3
4.log:1
4.log:12
4.log:"1"
4.log:5
4.log:43
說明:
查詢當前目錄下所有檔案,找出其中不包含"僅此一條"的行