shell指令碼(14)-正規表示式

Mrwhite86發表於2021-08-07

原文網址 : https://www.cnblogs.com/mrwhite2020/p/15021982.html

指令碼

一、正規表示式介紹

正規表示式是一種文字模式匹配，包括普通字元(a...z)和特殊字元(元字元)。

它是一種字串匹配模式，可以用來檢查一個字串是否含有某種子串、將匹配的子串替換或者從某個字串中取出某個條件的子串

shell支援正規表示式，但是不是所有的命令都支援正則，常見的命令中只有grep、sed、awk命令支援正規表示式

二、特殊字元

1、定位符使用-模糊匹配與精準匹配：

同時錨定開頭和結尾，做精確匹配；單一錨定開發和結尾，做模糊匹配。

定位符	說明
^	錨定開頭^a以a開發，預設錨定一個字元
$	錨定結尾a$以a結尾，預設錨定一個字元

舉例說明：定位符

[root@localhost test20210731]# egrep "^abbbc$" file  #正則匹配，等價於grep -e 或 grep -E，精確匹配
abbbc
[root@localhost test20210731]# egrep "^ab" file #匹配開頭為ab
abbbc
abababa
abC
[root@localhost test20210731]# egrep "bb$" file #匹配結尾為bb
aabb
&abbb
bbbb

2、匹配符-匹配字串：

匹配符	說明
.	匹配除回車以外的任意字元
()	字串分組
[]	定義字串，匹配括號中的一個字元
[^]	表示否定括號中出現字串的字元，取反
\	轉義字元
\|	管道-或，結合分組使用

舉例說明匹配符：

[root@localhost test20210806]# egrep "^a.c$" file  #匹配a開頭，c結尾，中間任意字元
aBc
aYc
a*c
a4c
a9c
a7c
[root@localhost test20210801]# egrep "^a[0-9]c$" file #匹配a開頭c結尾，中間的字元為0-9
a4c
a9c
a7c
[root@localhost test20210801]# egrep "^a[^0-9]c$" file #匹配a開頭c結尾，中間非數字
aBc
aYc
a*c
[root@localhost test20210801]# egrep "^a\*c$" file #精確匹配a*c的情況
a*c
[root@localhost test20210801]# egrep "^a*c$" file #不加轉義無法匹配
ac
[root@localhost test20210801]# egrep "^(a|b)c$" file #精確匹配以a或b開頭，c結尾
ac
bc

3、限定符-對前面的符合或字串做限定說明

限定符	說明
*	某個字元之後加星號表示該字元不出現或出現多次
？	與型號類似，但略有不行，表示該字元出現一次或不出現
+	與星號類似，表示其前面字元出現一次或多次，但是至少出現一次
{n,m}	某個字元之後出現，表示該字元最少n次，最多m次
{m}	某個字元出現m次

舉例說明限定符：

[root@localhost test20210806]# egrep "^ab*c$" file  #ab字元中匹配有b(全部需要是b)或沒有b
abbbc
ac
[root@localhost test20210806]# egrep "^ab*c$" file  #ab字元中匹配有b(全部需要是b)或沒有b
abbbc
ac
abc
[root@localhost test20210806]# egrep "^ab?c$" file  #ab字元中匹配有b(出現一次)或沒有b
ac
abc
[root@localhost test20210806]# egrep "^ab+c$" file  #ac字元中匹配有b(至少出現一次)
abbbc
abc
[root@localhost test20210806]# egrep "^ab*c$" file  #ac字元中匹配有b(全部需要是b)或沒有b
abbbc
ac
abc
[root@localhost test20210806]# egrep "^ab?c$" file  #ac字元中匹配有b(出現一次)或沒有b
ac
abc
[root@localhost test20210806]# egrep "^ab+c$" file  #ac字元中匹配有b(至少出現一次)
abbbc
abc
[root@localhost test20210806]# egrep "^ab{1,3}c$" file  #ac字元中匹配有b(出現在1次到3次內)
abbbc
abc
[root@localhost test20210806]# egrep "^ab{3}c$" file  #ac字元中匹配有b(正好出現3次)
abbbc

三、POSIX字元

特殊字元	說明
[:alnum:]	匹配任意字母字元0-9 a-z A-Z
[:alpha:]	匹配任意字母，大寫或小寫
[:dight:]	數字0-9
[:graph:]	非空字元(非空格控制字元)
[:lower:]	小寫字元a-z
[:upper:]	大寫字元A-Z
[:cntrl:]	控制字元
[:print:]	非空字元(包括空格)
[:punct:]	標點符號
[:blank:]	空格和TAB字元
[:xdigit:]	16進位制數字
[:space:]	所有空白字元(新行、空格、製表符)

注意：[[]]雙中括號的意思：第一個中括號是匹配符[]匹配中括號中的任意一個字元，第二個[]格式如[:digit:]

舉例說明：

[root@localhost tesr20210807]# egrep "^a[[:alnum:]]c$" file  #a開頭c結尾，中間一個字元匹配非特殊符號
aBc
aYc
a4c
a9c
a7c
abc
[root@localhost tesr20210807]# egrep "^a[[:alnum:]]c$" file  #a開頭c結尾，中間一個字元匹配任意字母
aBc
aYc
a4c
a9c
a7c
abc
[root@localhost tesr20210807]# egrep "^a[[:alnum:]]c$" file  #a開頭c結尾，中間一個字元匹配非特殊符號
aBc
aYc
a4c
a9c
a7c
abc
[root@localhost tesr20210807]# egrep ^C]c$" file  #a開頭c結尾，中間一個字元匹配任意字母
[root@localhost tesr20210807]# egrep "^a[[:alnum:]]c$" file  #a開頭c結尾，中間一個字元匹配非特殊符號
aBc
aYc
a4c
a9c
a7c
abc
[root@localhost tesr20210807]# egrep "^a[[:alpha:]]c$" file  #a開頭c結尾，中間一個字元匹配任意字母
aBc
aYc
abc
[root@localhost tesr20210807]# egrep "^a[[:digit:]]c$" file  #a開頭c結尾，中間一個字元匹配任意數字
a4c
a9c
a7c
[root@localhost tesr20210807]# egrep "^a[[:graph:]]c$" file  #a開頭c結尾，中間一個字元匹配非空字元
aBc
aYc
a*c
a4c
a9c
a7c
abc
a,c
[root@localhost tesr20210807]# egrep "^a[[:lower:]]c$" file  #a開頭c結尾，中間一個字元匹配小寫字母
abc
[root@localhost tesr20210807]# egrep "^a[[:upper:]]c$" file  #a開頭c結尾，中間一個字元匹配大寫字母
aBc
aYc
[root@localhost test20210807]# egrep "^a[[:blank:]]c$" file #a開頭c結尾，中間一個字元為空格或TAB
a c
a c
[root@localhost test20210807]# egrep "^a[[:space:]]c$" file #a開頭c結尾，中間匹配所有空白、空行、製表符
a c
a c
[root@localhost test20210807]# egrep "^a[[:blank:]]c$" file #a開頭c結尾，中間一個字元為空格或TAB
a c
a c
[root@localhost test20210807]# egrep "^a[[:space:]]c$" file #a開頭c結尾，中間匹配所有空白、空行、製表符
a c
a c
[root@localhost test20210807]# egrep "^a[[:blank:]]c$" file #a開頭c結尾，中間一個字元為空格或TAB
a c
a c
[root@localhost test20210807]# egrep "^a[[:space:]]c$" file #a開頭c結尾，中間一個字元匹配空白、空行、製表符
a c
a c
[root@localhost test20210807]# egrep "^a[[:punct:]]c$" file #a開頭c結尾，中間一個字元匹配標點符號
a*c
a,c
[root@localhost test20210807]# egrep "^a[[:print:]]c$" file #a開頭c結尾，中間一個字元匹配非空字元（含括號）
aBc
aYc
a*c
a4c
a9c
a7c
abc
a c
a,c
[root@localhost test20210807]# egrep "^a[[:xdigit:]]c$" file #a開頭c結尾，中間一個字元匹配十六進位制數
aBc
a4c
a9c
a7c
abc

四、常見正則匹配：

1、數字：^[0-9]*$

2、漢字：^[\u4e00-\u9fa5]{0,}$

3、英文字母：^[A-Za-z]+$

4、手機號碼：^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$

5、IP地址：((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))

更多正規表示式參考：

shell指令碼正規表示式
2024-04-21
指令碼
Shell正規表示式
2020-10-16
shell常用正規表示式
2018-12-15
shell高階-----正規表示式
2019-05-30
shell基礎 — 基本正規表示式
2018-10-08
shell 正規表示式詳細整理
2022-03-20
密碼正規表示式
2024-09-09
密碼
shell程式設計（四）| grep正規表示式
2018-06-21
程式設計
shell程式設計（四）| sed 正規表示式
2018-06-21
程式設計
05 shell程式設計之正規表示式
2018-06-11
程式設計
在 Shell 中轉換 Python 正規表示式
2024-03-13
Python
『忘了再學』Shell基礎 — 24、Shell正規表示式的使用
2022-06-01
正規表示式
2024-10-30
正規表示式.
2019-11-10
正規表示式（程式碼java版）
2020-09-27
Java
匹配空行正規表示式程式碼
2018-04-16
【正規表示式】常用的正規表示式（數字，漢字，字串，金額等的正規表示式）
2021-12-13
字串
Shell—擴充套件正規表示式（awk、sort、uniq、tr工具）
2020-11-13
套件
php –正規表示式
2019-02-16
PHP
【Linux】正規表示式
2018-10-18
Linux
【JavaScript】正規表示式
2019-03-02
JavaScript
URL正規表示式
2019-04-11
正規表示式 split()
2018-09-07
初探正規表示式
2018-05-11
正規表示式 test()
2018-05-27
正規表示式(?!)作用
2018-05-20
正規表示式 {n,}
2018-08-12
SQL正規表示式
2024-03-06
SQL
正規表示式(java)
2024-03-18
Java
Python——正規表示式
2019-08-05
Python
PHP正規表示式
2020-11-11
PHP
正規表示式概括
2020-10-04
javascript正規表示式
2020-11-09
JavaScript
java正規表示式
2020-11-21
Java
常用正規表示式
2024-11-18
正規表示式合集
2024-06-17
python正規表示式
2024-06-15
Python
【java】正規表示式
2018-04-05
Java

shell指令碼(14)-正規表示式

相關文章