正規表示式的小總結

碼鋒窩發表於2016-06-24

今天在專案中用到幾個之前用的比較少一點的正規表示式,剛好有時間整理一下,可能有一些不常用到,但估計下面的在iOS的開發中基本夠用,分享給大家,廢話不多,進入主題。

作用:
1.資料驗證— 測試輸入的字串,是否符合一定的規則,如email地址,網址,QQ號,電話號碼等
2.替換文字 — 識別文件的中的特定文字,例如:“”“\”之類的特殊字元。 如:文章排版(新增空格,Tab等)
3.提取字串 -- 提取一些特定的字元。
iOS中正規表示式的基本語法
 
首先,特殊符號’^'和’$'。他們的作用是分別指出一個字串的開始和結束。
“^one”:表示所有以”one”開始的字串(”one cat”,”one123″,·····);
“a dog$”:表示所以以”a dog”結尾的字串(”it is a dog”,·····);
“^apple$”:表示開始和結尾都是”apple”的字串,這個是唯一的~;
“banana”:表示任何包含”banana”的字串。
 
  ‘*’,’+'和’?'這三個符號,表示一個或N個字元重複出現的次數。它們分別表示“沒有或更多”([0,+∞]取整),“一次或更多”([1,+∞]取整),“沒有或一次”([0,1]取整)。下面是幾個例子:

  “ab*”:表示一個字串有一個a後面跟著零個或若干個b(”a”, “ab”, “abbb”,……);

  “ab+”:表示一個字串有一個a後面跟著至少一個b或者更多( ”ab”, “abbb”,……);

  “ab?”:表示一個字串有一個a後面跟著零個或者一個b( ”a”, “ab”);

  “a?b+$”:表示在字串的末尾有零個或一個a跟著一個或幾個b( ”b”, “ab”,”bb”,”abb”,……)。

  可以用大括號括起來({}),表示一個重複的具體範圍。例如

  “ab{4}”:表示一個字串有一個a跟著4個b(”abbbb”);

  “ab{1,}”:表示一個字串有一個a跟著至少1個b(”ab”,”abb”,”abbb”,……);

  “ab{3,4}”:表示一個字串有一個a跟著3到4個b(”abbb”,”abbbb”)。

  那麼,“*”可以用{0,}表示,“+”可以用{1,}表示,“?”可以用{0,1}表示

  注意:可以沒有下限,但是不能沒有上限!例如“ab{,5}”是錯誤的寫法

  “ | ”表示“或”操作:

  “a|b”:表示一個字串裡有”a”或者”b”;

  “(a|bcd)ef”:表示”aef”或”bcdef”;

  “(a|b)*c”:表示一串”a”"b”混合的字串後面跟一個”c”;

  方括號”[ ]“表示在括號內的眾多字元中,選擇1-N個括號內的符合語法的字元作為結果,例如

  “[ab]“:表示一個字串有一個”a”或”b”(相當於”a|b”);

  “[a-d]“:表示一個字串包含小寫的’a'到’d'中的一個(相當於”a|b|c|d”或者”[abcd]“);

  “^[a-zA-Z]“:表示一個以字母開頭的字串;

  “[0-9]a”:表示a前有一位的數字;

  “[a-zA-Z0-9]$”:表示一個字串以一個字母或數字結束。

  “.”匹配除“\r\n”之外的任何單個字元:

  “a.[a-z]“:表示一個字串有一個”a”後面跟著一個任意字元和一個小寫字母;

  “^.{5}$”:表示任意1個長度為5的字串;

  “\num” 其中num是一個正整數。表示”\num”之前的字元出現相同的個數,例如

  “(.)\1″:表示兩個連續的相同字元。

  “10\{1,2\}” : 表示數字1後面跟著1或者2個0 (“10″,”100″)。

  ” 0\{3,\} ” 表示數字為至少3個連續的0 (“000”,“0000”,······)。

  在方括號裡用’^'表示不希望出現的字元,’^'應在方括號裡的第一位。

  “@[^a-zA-Z]4@”表示兩個”@”中不應該出現字母)。

常用的還有:
  “ \d ”匹配一個數字字元。等價於[0-9]。
  “ \D”匹配一個非數字字元。等價於[^0-9]。
  “ \w ”匹配包括下劃線的任何單詞字元。等價於“[A-Za-z0-9_]”。
  “ \W ”匹配任何非單詞字元。等價於“[^A-Za-z0-9_]”。
  iOS中書寫正規表示式,碰到轉義字元,多加一個“\”,例如:
  全數字字元:@”^\\d\+$”
 
 
IOS常用正規表示式
正規表示式用於字串處理、表單驗證等場合,實用高效。現將一些常用的表示式收集於此,以備不時之需。
匹配中文字元的正規表示式: [\u4e00-\u9fa5]
評註:匹配中文還真是個頭疼的事,有了這個表示式就好辦了

匹配雙位元組字元(包括漢字在內):[^\x00-\xff]
評註:可以用來計算字串的長度(一個雙位元組字元長度計2,ASCII字元計1)

匹配空白行的正規表示式:\n\s*\r
評註:可以用來刪除空白行

配HTML標記的正規表示式:<(\S*?)[^>]*>.*?</\1>|<.*? />
評註:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對於複雜的巢狀標記依舊沒有能力為力

匹配首尾空白字元的正規表示式:^\s*|\s*$
評註:可以用來刪除行首行尾的空白字元(包括空格、製表符、換頁符等等),非常有用的表示式

匹配Email地址的正規表示式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
評註:表單驗證時很實用

匹配網址URL的正規表示式:[a-zA-z]+://[^\s]*
評註:網上流傳的版本功能很有限,上面這個基本可以滿足需求

匹配帳號是否合法(字母開頭,允許5-16位元組,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評註:表單驗證時很實用

匹配國內電話號碼:\d{3}-\d{8}|\d{4}-\d{7}
評註:匹配形式如 0511-4405222 或 021-87888822

匹配騰訊QQ號:[1-9][0-9]{4,}
評註:騰訊QQ號從10000開始

匹配中國郵政編碼:[1-9]\d{5}(?!\d)
評註:中國郵政編碼為6位數字

匹配身份證:\d{15}|\d{18}
評註:中國的身份證為15位或18位

匹配ip地址:\d+\.\d+\.\d+\.\d+
評註:提取ip地址時有用

匹配特定數字:
^[1-9]\d*$    //匹配正整數
^-[1-9]\d*$   //匹配負整數
^-?[1-9]\d*$   //匹配整數
^[1-9]\d*|0$  //匹配非負整數(正整數 + 0)
^-[1-9]\d*|0$   //匹配非正整數(負整數 + 0)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$   //匹配正浮點數
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$  //匹配負浮點數
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$  //匹配浮點數
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$   //匹配非負浮點數(正浮點數 + 0)
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$  //匹配非正浮點數(負浮點數 + 0)
評註:處理大量資料時有用,具體應用時注意修正

匹配特定字串:
^[A-Za-z]+$  //匹配由26個英文字母組成的字串
^[A-Z]+$  //匹配由26個英文字母的大寫組成的字串
^[a-z]+$  //匹配由26個英文字母的小寫組成的字串
^[A-Za-z0-9]+$  //匹配由數字和26個英文字母組成的字串
^\w+$  //匹配由數字、26個英文字母或者下劃線組成的字串 
 
 
英文字母:[a-zA-Z] 
 
匹配中文,英文字母和數字及_:
^[\u4e00-\u9fa5_a-zA-Z0-9]+$

同時判斷輸入長度:
[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}

^[\w\u4E00-\u9FA5\uF900-\uFA2D]*$ 1、一個正規表示式,只含有漢字、數字、字母、下劃線不能以下劃線開頭和結尾:
^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$  其中:
^  與字串開始的地方匹配
(?!_)  不能以_開頭
(?!.*?_$)  不能以_結尾
[a-zA-Z0-9_\u4e00-\u9fa5]+  至少一個漢字、數字、字母、下劃線
$  與字串結束的地方匹配

放在程式裡前面加@,否則需要\\進行轉義 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$"
(或者:@"^(?!_)\w*(?<!_)$"    或者  @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ "  )

2、只含有漢字、數字、字母、下劃線,下劃線位置不限:
          ^[a-zA-Z0-9_\u4e00-\u9fa5]+$

3、由數字、26個英文字母或者下劃線組成的字串
          ^\w+$

4、2~4個漢字
          @"^[\u4E00-\u9FA5]{2,4}$"; 
 
5.最長不得超過7個漢字,或14個位元組(數字,字母和下劃線)正規表示式
 
          ^[\u4e00-\u9fa5]{1,7}$|^[\dA-Za-z_]{1,14}$
 
7.匹配月份的正規表示式
 
^[1-9]$|^1[0-2]$
注:個位數月份匹配方式 前面不能加 0。
^0?[1-9]$|^1[0-2]$
注:個位數月份前可以加0或者不加。
 
匹配年份19**或者20**
^(19|20)[0-9]{2}$
 
8.提取html中的超連結。
(]*)(href="https?:\/\/)((?!(?:(?:www\.)?'.implode('|(?:www\.)?',$follow_list).'))[^"]+)"((?!.*\brel=)[^>]*)(?:[^>]*)>
 
9.提取URL連結
     ^(f|ht){1}(tp|tps):\/\/([\w-]+\.)+[\w-]+(\/[\w-./?%&=]*)?
 
一個常用的線上測試工具:http://tool.oschina.net/regex/

 

相關文章