python3的正規表示式（regex）

覆手為雲p發表於2017-05-12

原文網址 : https://www.cnblogs.com/aland-1415/p/6846949.html

正規表示式提供了一種緊湊的表示法，可用於表示字串的組合，一個單獨的正規表示式可以表示無限數量的字串。常用的5種用途：分析、搜尋、搜尋與替代、字串的分割、驗證。

（一）正規表示式語言
python中特殊字元有 \.^$?+*{}[]()|
1、字元類速記
^ 　　如果在字元類中第一個字元則表示否定；
-　　表示一個字元範圍，如果作為字元類中的第一個字元，就表示一個字面意義上的連字元；
. 　　可以匹配除換行符之外的任意字元，或帶re.DOTALL標記的任意字元，或匹配字元類內部的字面意義的字元；
\d　匹配一個Unicode數字，或帶re.ASCII標記的[0-9];
\D　　匹配一個Unicode非數字，或帶re.ASCII標記的[^0-9];
\s 　　匹配Unicode空白，或帶re.ASCII標記的[\t\n\r\f\v];
\S 　　匹配Unicode非空白，或帶re.ASCII標記的[^\t\n\r\f\v];
\w 　　匹配一個Unicode單詞字元，或帶re.ASCII標記的[a-zA-Z0-9_];
\W 　　匹配一個Unicode非單詞字元，或帶re.ASCII標記的[^a-zA-Z0-9_]

2、量詞
格式{m,n}，m與n分別表示使用該量詞的表達必須匹配的最少次數與最多次數。如果只給定一個數字則同時表示最小值最大值
量詞速記形式：
e{m}   　　準確匹配表示式e的m次出現
e{m,}   　　貪婪地匹配表示式e至少m次出現
e{m,}?   　非貪婪地匹配表示式e至少m次出現
e{,n}   　　最多n次出現
e{,n}?   　貪婪
e?   　　　 e{0,1}
e??   　　　e{0,1}?
e+   　　    e{1,}
e+?   　　　e{1,}?
e*   　　　 e{0,}
e*?   　　 e{0,}?
[]   　　　匹配[]內的任意一個內容
（）   　　將（）的內容作為一個整體來進行匹配
貪婪表示會盡可以多的匹配符合條件的字元，非貪婪則為儘可以少的匹配。

3、可用air(craft|plane)來匹配 aircraft和airplane。
使用air(?:craft|plane)可以用來限制當處於更多的巢狀中時，aricraft和airplane只有一次捕獲。圓括號表示組。

4、\i反向引用，i表示前面的捕獲號。捕獲號也可以用在左圓括號前加 ?P<name>來用名稱代替
如：(?P<key>\w+)=(?P<value>.+)對於捕獲進行反向引用(?P=name)： (?P<word>\w+)\s+(?P=word) 可以使用名為"word"的捕獲來匹配重複的單詞。

5、正規表示式斷言：
^    在起始處匹配，也可以在帶MULTILINE標記的每個換行符後匹配；
$      在結尾處匹配，也可以在帶MULTILINE標記的每個換行符前匹配；
\A    在起始處匹配；
\b   在單詞邊界匹配，受re.ASCII影響，如果在字元內部則是backspace的轉義字元；
\B   在非單詞邊界匹配，受re.ASCII影響；
\Z   在結尾處匹配；
(?=e)   如果表示式e在此斷言處匹配，但沒有超出此處——稱為前瞻或正前瞻，則匹配；
(?!e)   如果表示式e在此斷言處不匹配，但沒有超出此處——稱為負前瞻，則匹配；
(?<=e)   如果表示式e恰在本斷言之前匹配——稱為正回顧，則匹配；
(?<!e)   如果表示式e恰在本斷言之前不匹配——稱為負回顧，則匹配；

6、正規表示式的註釋
可用(?#the comment)來實現，也可用re.VERBOSE標記。

（二）正規表示式模組
正規表示式模組標記：
re.A 或 re.ASCII
re.I 或 re.IGNORECASE   忽略大小寫
re.M 或 re.MULTILINE   使^在起始處並在每個換行符後匹配，使$在結尾處但在每個換行符之前匹配
re.S 或 re.DOTALL   使.匹配每個字元，包括換行符
re.X 或 re.VERBOSE   使空白與註釋包含在匹配中

正規表示式模組的函式（供查）：
re.compile(r,f)   返回編譯後的正規表示式r，如果指定，就將其標記設定為f(即上邊的re.A等，且可同時有多個標記，用|分隔)；(使用re'regex'的形式表達字串可不用轉義)
re.escape(s)   返回字串s,其中所有非字母數字的字元都使用反斜線進行了轉義處理，因此，返回的字串中沒有特殊的正規表示式字元；
re.findall(r,s,f)    返回正規表示式r在字串s中所有非交疊的匹配（如果給定f,就受其制約）。如果正規表示式中有捕獲，那麼每次匹配都作為一個捕獲元組返回；
re.finditer(r,s,f) 對正規表示式r在字串s中每個非交疊的匹配（如果給定了f，就受其制約），都返回一個匹配物件；
re.match(r,s,f)   如果正規表示式r在字串s的起始處匹配（如果給定f，就受其制約），就返回一個匹配物件(MatchObject)，否則返回None;
re.search(r,s,f)   如果正規表示式r在字串s的任意位置匹配（如果給定f,就受其制約），就返回一個匹配物件，否則返回None;
re.split(r,s,m)   返回分割字串s(在正規表示式r每次出現處進行分割）所產生的字串的列表，至多分割m次（如果沒有給定m,就儘可能多的分割），如果正規表示式中包含捕獲，就被包含在分割的部分之間；
re.sub(r,x,s,m)   對正規表示式r的每次匹配（如果給定m，那麼至多m次），返回字串s的一個副本，並將其替換為x--這可以是一個字串，也可以是一個函式；
re.subn(r,x,s,m) 與re.sub()函式相同，區別在於此函式返回一個二元組；

匹配物件屬性與方法:
m.end(g)   　　返回組g(如果給定）在文字匹配的終點索引位置，對組0，則表示整體匹配；如果匹配中不包含該組，就返回-1；
m.endpos  　　搜尋的終點索引位置
m.expands(s)   返回字串s,並將其中捕獲標識用相應的捕獲替代；
m.group(g,...)   返回編號的或命名的組g,如果給定的不止一個，就返回相應的捕獲組成的元組；
m.groupdict(difault) 返回一個字典，其中存放所有命名的捕獲組，組名作為鍵，捕獲作為值；如果給定了default引數，就將其用作那些不參與匹配的捕獲組的值；
m.groups(default）返回包含所有捕獲的元組，從1開始；如果給定default,就將其用作那此不參與匹配的捕獲組的值；
m.lastgroup       匹配的、編號最高的捕獲組的名稱，如果不存在或沒有使用名稱，就返回None;
m.lastindex   　匹配的、編號最高的捕獲組的編號，如果沒有就返回None;
m.pos       　　搜尋的起始索引位置；
m.re       　　   產生這一匹配物件的正規表示式物件；
m.span(g)   　　如果給定g,就返回組g在文字中匹配的起始索引位置與結尾位置；（對組0，則是整體匹配）；如果該組不參與匹配，就返回（-1，-1）；
m.start(g)   　　如果給定g,就返回組g在文字中匹配的起始索引位置（對組0，則是整體匹配）；如果該組不參加匹配，就返回-1；
m.string   　　   傳遞給match()或search()的字串；

Grep（Regex）中的正規表示式
2020-07-29
Python 正規表示式（RegEx）指南
2023-11-02
Python
Regex 正規表示式入門
2020-05-04
Java-正規表示式regex庫
2018-08-27
Java
正規表示式（python3）
2021-03-11
Python
learn-regex：正規表示式學習資源
2022-03-08
瘋狂Java講義_07_正規表示式RegEx
2020-11-29
Java
Python3之正規表示式詳解
2019-07-25
Python
郵箱/郵件地址的正規表示式及分析(JavaScript，email，regex)
2018-03-12
JavaScriptAI
身份證號碼的正規表示式及驗證詳解(JavaScript，Regex)
2018-03-14
JavaScript
【正規表示式】常用的正規表示式（數字，漢字，字串，金額等的正規表示式）
2021-12-13
字串
正規表示式
2024-10-30
正規表示式.
2019-11-10
ExtJS4的文字框(textField)使用正規表示式進行驗證(Regex)的方法
2022-03-22
JS
Linux 的正規表示式
2020-02-06
Linux
JS常用正規表示式及驗證時間的正規表示式
2022-03-19
JS
Python3正規表示式之：(?(id/name)yes-pattern|no-
2020-12-11
Python
php –正規表示式
2019-02-16
PHP
【Linux】正規表示式
2018-10-18
Linux
【JavaScript】正規表示式
2019-03-02
JavaScript
URL正規表示式
2019-04-11
正規表示式 split()
2018-09-07
初探正規表示式
2018-05-11
正規表示式 test()
2018-05-27
正規表示式(?!)作用
2018-05-20
正規表示式 {n,}
2018-08-12
SQL正規表示式
2024-03-06
SQL
正規表示式(java)
2024-03-18
Java
Python——正規表示式
2019-08-05
Python
PHP正規表示式
2020-11-11
PHP
正規表示式概括
2020-10-04
javascript正規表示式
2020-11-09
JavaScript
java正規表示式
2020-11-21
Java
Shell正規表示式
2020-10-16
常用正規表示式
2024-11-18
正規表示式合集
2024-06-17
python正規表示式
2024-06-15
Python
【java】正規表示式
2018-04-05
Java
MySQL正規表示式
2024-07-30
MySql

python3的正規表示式（regex）

相關文章