正則雜談

干炸小黄鱼發表於2024-06-03

常用匹配規則

. 除換行符以外的所有字元。
^ 字串開頭。
$ 字串結尾。
\d,\w,\s 匹配數字、字元、空格。
\D,\W,\S 匹配非數字、非字元、非空格。
[abc] 匹配 a、b 或 c 中的一個字母。
[a-z] 匹配 a 到 z 中的一個字母。
[^abc] 匹配除了 a、b 或 c 中的其他字母。
a|b 匹配 a 或 b。
? 0 次或 1 次匹配。
* 匹配 0 次或多次。
+ 匹配 1 次或多次。
{n} 匹配 n次。
{n,} 匹配 n次以上。
{m,n} 最少 m 次,最多 n 次匹配。
(expr) 捕獲 expr 子模式,以 \1 使用它。
(?:expr) 忽略捕獲的子模式。
(?=expr) 正向預查模式 expr。
(?!expr) 負向預查模式 expr。
\ 特殊字元轉義

常用正規表示式
校驗數字的表示式
數字:\d+
n位的數字:\d{n}
至少n位的數字:\d{n,}
m-n位的數字:\d{m,n}
非零開頭的最多帶兩位小數的數字:[1-9]\d+.\d{1,2}
帶1-2位小數的正數或負數:-?\d+.\d{1,2}
正數、負數、和小數:(-|+)?\d+(.\d+)?
有兩位小數的正實數:[0-9]+(.[0-9]{2})?
有1~3位小數的正實數:[0-9]+(.[0-9]{1,3})?
非零的正整數:[1-9]\d*
非零的負整數:-[1-9]\d*
非負整數:\d+
非正整數:-[1-9]\d*|0
正浮點數:\d+.\d+
負浮點數:-\d+.\d+
浮點數:-?\d+.\d+

校驗字元的表示式
漢字:[\u4e00-\u9fa5]{0,}
英文和數字:[A-Za-z0-9]+ 或 [A-Za-z0-9]{4,40}
長度為3-20的所有字元:.{3,20}
由26個英文字母組成的字串:[A-Za-z]+
由26個大寫英文字母組成的字串:[A-Z]+
由26個小寫英文字母組成的字串:[a-z]+
由數字和26個英文字母組成的字串:[A-Za-z0-9]+
由數字、26個英文字母或者下劃線組成的字串:\w+ 或 \w{3,20}
中文、英文、數字包括下劃線:[\u4E00-\u9FA5A-Za-z0-9_]+
中文、英文、數字但不包括下劃線等符號:[\u4E00-\u9FA5A-Za-z0-9]+ 或 [\u4E00-\u9FA5A-Za-z0-9]{2,20}
匹配除了 #$* 外的字元:[^#$*]+

特殊需求表示式
使用者名稱(字母開頭,允許5-16位元組,允許字母數字下劃線):[a-zA-Z][a-zA-Z0-9_]{4,15}
密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):[a-zA-Z]\w{5,17}
強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字元,長度在 8-10 之間):(?=.\d)(?=.[a-z])(?=.[A-Z])[a-zA-Z0-9]{8,10}
強密碼(必須包含大小寫字母和數字的組合,可以使用特殊字元,長度在8-10之間):(?=.
\d)(?=.[a-z])(?=.[A-Z]).{8,10}
Email地址:\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*
域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+.?
InternetURL:[a-zA-z]+://[^\s]* 或 http://([\w-]+.)+[\w-]+(/[\w-./?%&=]*)?
手機號碼:(13[0-9]|14[5|7]|15[0|1|2|3|4|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}
電話號碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):((\d{3,4}-)|\d{3.4}-)?\d{7,8}
國內電話號碼(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
電話號碼正規表示式(支援手機號碼,3-4位區號,7-8位直播號碼,1-4位分機號): ((\d{11})|^((\d{7,8})|(\d{4}|\d{3})-(\d{7,8})|(\d{4}|\d{3})-(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1})|(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1}))$)
身份證號(15位、18位數字),最後一位是校驗位,可能為數字或字元X:(\d{15})|(\d{18})|(\d{17}(\d|X|x))
日期格式:\d{4}-\d{1,2}-\d{1,2}
一年的12個月(01~09和1~12):(0?[1-9]|1[0-2])
一個月的31天(01~09和1~31):((0?[1-9])|((1|2)[0-9])|30|31)
錢的輸入格式

  1. 有四種錢的表示形式我們可以接受:"10000.00" 和 "10,000.00", 和沒有 "分" 的 "10000" 和 "10,000":[1-9][0-9]*
  2. 這表示任意一個不以0開頭的數字,但是,這也意味著一個字元"0"不透過,所以我們採用下面的形式:(0|[1-9][0-9]*)
  3. 一個0或者一個不以0開頭的數字.我們還可以允許開頭有一個負號:(0|-?[1-9][0-9]*)
  4. 這表示一個0或者一個可能為負的開頭不為0的數字.讓使用者以0開頭好了.把負號的也去掉,因為錢總不能是負的吧。下面我們要加的是說明可能的小數部分:[0-9]+(.[0-9]+)?
  5. 必須說明的是,小數點後面至少應該有1位數,所以"10."是不透過的,但是 "10" 和 "10.2" 是透過的:[0-9]+(.[0-9]{2})?
  6. 這樣我們規定小數點後面必須有兩位,如果你認為太苛刻了,可以這樣:[0-9]+(.[0-9]{1,2})?
  7. 這樣就允許使用者只寫一位小數.下面我們該考慮數字中的逗號了,我們可以這樣:[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?
  8. 1到3個數字,後面跟著任意個 逗號+3個數字,逗號成為可選,而不是必須:([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?
  9. 備註:這就是最終結果了,別忘了"+"可以用""替代如果你覺得空字串也可以接受的話(奇怪,為什麼?)最後,別忘了在用函式時去掉去掉那個反斜槓,一般的錯誤都在這裡
    xml檔案:([a-zA-Z]+-?)+[a-zA-Z0-9]+\.[x|X][m|M][l|L]
    中文字元的正規表示式:[\u4e00-\u9fa5]
    雙位元組字元:[^\x00-\xff] (包括漢字在內,可以用來計算字串的長度(一個雙位元組字元長度計2,ASCII字元計1))
    空白行的正規表示式:\n\s
    \r (可以用來刪除空白行)
    HTML標記的正規表示式:<(\S?)[^>]>.?|<.? /> ( 首尾空白字元的正規表示式:\s|\s$或(^\s)|(\s$) (可以用來刪除行首行尾的空白字元(包括空格、製表符、換頁符等等),非常有用的表示式)
    騰訊QQ號:[1-9][0-9]{4,} (騰訊QQ號從10000開始)
    中國郵政編碼:[1-9]\d{5}(?!\d) (中國郵政編碼為6位數字)
    IPv4地址:((2(5[0-5]|[0-4]\d))|[0-1]?\d{1,2})(.((2(5[0-5]|[0-4]\d))|[0-1]?\d{1,2}))