今天在專案中用到幾個之前用的比較少一點的正規表示式,剛好有時間整理一下,可能有一些不常用到,但估計下面的在iOS的開發中基本夠用,分享給大家,廢話不多,進入主題。
“ab*”:表示一個字串有一個a後面跟著零個或若干個b(”a”, “ab”, “abbb”,……);
“ab+”:表示一個字串有一個a後面跟著至少一個b或者更多( ”ab”, “abbb”,……);
“ab?”:表示一個字串有一個a後面跟著零個或者一個b( ”a”, “ab”);
“a?b+$”:表示在字串的末尾有零個或一個a跟著一個或幾個b( ”b”, “ab”,”bb”,”abb”,……)。
可以用大括號括起來({}),表示一個重複的具體範圍。例如
“ab{4}”:表示一個字串有一個a跟著4個b(”abbbb”);
“ab{1,}”:表示一個字串有一個a跟著至少1個b(”ab”,”abb”,”abbb”,……);
“ab{3,4}”:表示一個字串有一個a跟著3到4個b(”abbb”,”abbbb”)。
那麼,“*”可以用{0,}表示,“+”可以用{1,}表示,“?”可以用{0,1}表示
注意:可以沒有下限,但是不能沒有上限!例如“ab{,5}”是錯誤的寫法
“ | ”表示“或”操作:
“a|b”:表示一個字串裡有”a”或者”b”;
“(a|bcd)ef”:表示”aef”或”bcdef”;
“(a|b)*c”:表示一串”a”"b”混合的字串後面跟一個”c”;
方括號”[ ]“表示在括號內的眾多字元中,選擇1-N個括號內的符合語法的字元作為結果,例如
“[ab]“:表示一個字串有一個”a”或”b”(相當於”a|b”);
“[a-d]“:表示一個字串包含小寫的’a'到’d'中的一個(相當於”a|b|c|d”或者”[abcd]“);
“^[a-zA-Z]“:表示一個以字母開頭的字串;
“[0-9]a”:表示a前有一位的數字;
“[a-zA-Z0-9]$”:表示一個字串以一個字母或數字結束。
“.”匹配除“\r\n”之外的任何單個字元:
“a.[a-z]“:表示一個字串有一個”a”後面跟著一個任意字元和一個小寫字母;
“^.{5}$”:表示任意1個長度為5的字串;
“\num” 其中num是一個正整數。表示”\num”之前的字元出現相同的個數,例如
“(.)\1″:表示兩個連續的相同字元。
“10\{1,2\}” : 表示數字1後面跟著1或者2個0 (“10″,”100″)。
” 0\{3,\} ” 表示數字為至少3個連續的0 (“000”,“0000”,······)。
在方括號裡用’^'表示不希望出現的字元,’^'應在方括號裡的第一位。
“@[^a-zA-Z]4@”表示兩個”@”中不應該出現字母)。
評註:匹配中文還真是個頭疼的事,有了這個表示式就好辦了
匹配雙位元組字元(包括漢字在內):[^\x00-\xff]
評註:可以用來計算字串的長度(一個雙位元組字元長度計2,ASCII字元計1)
匹配空白行的正規表示式:\n\s*\r
評註:可以用來刪除空白行
匹配HTML標記的正規表示式:<(\S*?)[^>]*>.*?</\1>|<.*? />
評註:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對於複雜的巢狀標記依舊沒有能力為力
匹配首尾空白字元的正規表示式:^\s*|\s*$
評註:可以用來刪除行首行尾的空白字元(包括空格、製表符、換頁符等等),非常有用的表示式
匹配Email地址的正規表示式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
評註:表單驗證時很實用
匹配網址URL的正規表示式:[a-zA-z]+://[^\s]*
評註:網上流傳的版本功能很有限,上面這個基本可以滿足需求
匹配帳號是否合法(字母開頭,允許5-16位元組,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評註:表單驗證時很實用
匹配國內電話號碼:\d{3}-\d{8}|\d{4}-\d{7}
評註:匹配形式如 0511-4405222 或 021-87888822
匹配騰訊QQ號:[1-9][0-9]{4,}
評註:騰訊QQ號從10000開始
匹配中國郵政編碼:[1-9]\d{5}(?!\d)
評註:中國郵政編碼為6位數字
匹配身份證:\d{15}|\d{18}
評註:中國的身份證為15位或18位
匹配ip地址:\d+\.\d+\.\d+\.\d+
評註:提取ip地址時有用
匹配特定數字:
^[1-9]\d*$ //匹配正整數
^-[1-9]\d*$ //匹配負整數
^-?[1-9]\d*$ //匹配整數
^[1-9]\d*|0$ //匹配非負整數(正整數 + 0)
^-[1-9]\d*|0$ //匹配非正整數(負整數 + 0)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ //匹配正浮點數
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ //匹配負浮點數
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ //匹配浮點數
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ //匹配非負浮點數(正浮點數 + 0)
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ //匹配非正浮點數(負浮點數 + 0)
評註:處理大量資料時有用,具體應用時注意修正
匹配特定字串:
^[A-Za-z]+$ //匹配由26個英文字母組成的字串
^[A-Z]+$ //匹配由26個英文字母的大寫組成的字串
^[a-z]+$ //匹配由26個英文字母的小寫組成的字串
^[A-Za-z0-9]+$ //匹配由數字和26個英文字母組成的字串
^\w+$ //匹配由數字、26個英文字母或者下劃線組成的字串
同時判斷輸入長度:
[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}
^[\w\u4E00-\u9FA5\uF900-\uFA2D]*$ 1、一個正規表示式,只含有漢字、數字、字母、下劃線不能以下劃線開頭和結尾:
^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$ 其中:
^ 與字串開始的地方匹配
(?!_) 不能以_開頭
(?!.*?_$) 不能以_結尾
[a-zA-Z0-9_\u4e00-\u9fa5]+ 至少一個漢字、數字、字母、下劃線
$ 與字串結束的地方匹配
放在程式裡前面加@,否則需要\\進行轉義 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$"
(或者:@"^(?!_)\w*(?<!_)$" 或者 @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ " )
2、只含有漢字、數字、字母、下劃線,下劃線位置不限:
3、由數字、26個英文字母或者下劃線組成的字串
4、2~4個漢字
(]*)(href=
"https?:\/\/)((?!(?:(?:www\.)?'.implode('|(?:www\.)?',$follow_list).'))[^"
]+)"((?!.*\brel=)[^>]*)(?:[^>]*)>
^(f|ht){1}(tp|tps):\/\/([\w-]+\.)+[\w-]+(\/[\w-./?%&=]*)?