正規表示式的小總結

碼鋒窩發表於2016-06-24

今天在專案中用到幾個之前用的比較少一點的正規表示式，剛好有時間整理一下，可能有一些不常用到，但估計下面的在iOS的開發中基本夠用，分享給大家，廢話不多，進入主題。

作用：

1.資料驗證— 測試輸入的字串，是否符合一定的規則，如email地址，網址，QQ號，電話號碼等

2.替換文字 — 識別文件的中的特定文字，例如：“”“\”之類的特殊字元。如：文章排版（新增空格，Tab等）

3.提取字串 -- 提取一些特定的字元。

iOS中正規表示式的基本語法

首先，特殊符號’^'和’$'。他們的作用是分別指出一個字串的開始和結束。

“^one”：表示所有以”one”開始的字串（”one cat”，”one123″，·····）；

“a dog$”：表示所以以”a dog”結尾的字串（”it is a dog”，·····）；

“^apple$”：表示開始和結尾都是”apple”的字串，這個是唯一的~；

“banana”：表示任何包含”banana”的字串。

　　‘*’，’+'和’?'這三個符號，表示一個或N個字元重複出現的次數。它們分別表示“沒有或更多”（[0,+∞]取整），“一次或更多”（[1,+∞]取整），“沒有或一次”（[0,1]取整）。下面是幾個例子：

　　“ab*”：表示一個字串有一個a後面跟著零個或若干個b（”a”, “ab”, “abbb”,……）；

　　“ab+”：表示一個字串有一個a後面跟著至少一個b或者更多（ ”ab”, “abbb”,……）；

　　“ab?”：表示一個字串有一個a後面跟著零個或者一個b（ ”a”, “ab”）；

　　“a?b+$”：表示在字串的末尾有零個或一個a跟著一個或幾個b（ ”b”, “ab”,”bb”,”abb”,……）。

　　可以用大括號括起來（{}），表示一個重複的具體範圍。例如

　　“ab{4}”：表示一個字串有一個a跟著4個b（”abbbb”）；

　　“ab{1,}”：表示一個字串有一個a跟著至少1個b（”ab”,”abb”,”abbb”,……)；

　　“ab{3,4}”：表示一個字串有一個a跟著3到4個b（”abbb”,”abbbb”)。

　　那麼，“*”可以用{0，}表示，“+”可以用{1，}表示，“?”可以用{0，1}表示

　　注意：可以沒有下限，但是不能沒有上限！例如“ab{,5}”是錯誤的寫法

　　“ | ”表示“或”操作：

　　“a|b”：表示一個字串裡有”a”或者”b”；

　　“(a|bcd)ef”：表示”aef”或”bcdef”；

　　“(a|b)*c”：表示一串”a”"b”混合的字串後面跟一個”c”；

　　方括號”[ ]“表示在括號內的眾多字元中，選擇1-N個括號內的符合語法的字元作為結果，例如

　　“[ab]“：表示一個字串有一個”a”或”b”（相當於”a|b”）；

　　“[a-d]“：表示一個字串包含小寫的’a'到’d'中的一個（相當於”a|b|c|d”或者”[abcd]“）；

　　“^[a-zA-Z]“：表示一個以字母開頭的字串；

　　“[0-9]a”：表示a前有一位的數字；

　　“[a-zA-Z0-9]$”：表示一個字串以一個字母或數字結束。

　　“.”匹配除“\r\n”之外的任何單個字元：

　　“a.[a-z]“：表示一個字串有一個”a”後面跟著一個任意字元和一個小寫字母；

　　“^.{5}$”：表示任意1個長度為5的字串；

　　“\num” 其中num是一個正整數。表示”\num”之前的字元出現相同的個數，例如

　　“(.)\1″：表示兩個連續的相同字元。

　　“10\{1,2\}” : 表示數字1後面跟著1或者2個0 (“10″,”100″)。

　　” 0\{3,\} ” 表示數字為至少3個連續的0 （“000”，“0000”，······）。

　　在方括號裡用’^'表示不希望出現的字元，’^'應在方括號裡的第一位。

　　“@[^a-zA-Z]4@”表示兩個”@”中不應該出現字母）。

常用的還有：

　　“ \d ”匹配一個數字字元。等價於[0-9]。

　　“ \D”匹配一個非數字字元。等價於[^0-9]。

　　“ \w ”匹配包括下劃線的任何單詞字元。等價於“[A-Za-z0-9_]”。

　　“ \W ”匹配任何非單詞字元。等價於“[^A-Za-z0-9_]”。

　　iOS中書寫正規表示式，碰到轉義字元，多加一個“\”,例如：

　　全數字字元：@”^\\d\+$”

IOS常用正規表示式

正規表示式用於字串處理、表單驗證等場合，實用高效。現將一些常用的表示式收集於此，以備不時之需。

匹配中文字元的正規表示式： [\u4e00-\u9fa5]
評註：匹配中文還真是個頭疼的事，有了這個表示式就好辦了

匹配雙位元組字元(包括漢字在內)：[^\x00-\xff]
評註：可以用來計算字串的長度（一個雙位元組字元長度計2，ASCII字元計1）

匹配空白行的正規表示式：\n\s*\r
評註：可以用來刪除空白行

匹配HTML標記的正規表示式：<(\S*?)[^>]*>.*?</\1>|<.*? />
評註：網上流傳的版本太糟糕，上面這個也僅僅能匹配部分，對於複雜的巢狀標記依舊沒有能力為力

匹配首尾空白字元的正規表示式：^\s*|\s*$
評註：可以用來刪除行首行尾的空白字元(包括空格、製表符、換頁符等等)，非常有用的表示式

匹配Email地址的正規表示式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
評註：表單驗證時很實用

匹配網址URL的正規表示式：[a-zA-z]+://[^\s]*
評註：網上流傳的版本功能很有限，上面這個基本可以滿足需求

匹配帳號是否合法(字母開頭，允許5-16位元組，允許字母數字下劃線)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評註：表單驗證時很實用

匹配國內電話號碼：\d{3}-\d{8}|\d{4}-\d{7}
評註：匹配形式如 0511-4405222 或 021-87888822

匹配騰訊QQ號：[1-9][0-9]{4,}
評註：騰訊QQ號從10000開始

匹配中國郵政編碼：[1-9]\d{5}(?!\d)
評註：中國郵政編碼為6位數字

匹配身份證：\d{15}|\d{18}
評註：中國的身份證為15位或18位

匹配ip地址：\d+\.\d+\.\d+\.\d+
評註：提取ip地址時有用

匹配特定數字：
^[1-9]\d*$　　 //匹配正整數
^-[1-9]\d*$ 　 //匹配負整數
^-?[1-9]\d*$　　 //匹配整數
^[1-9]\d*|0$　 //匹配非負整數（正整數 + 0）
^-[1-9]\d*|0$　　 //匹配非正整數（負整數 + 0）
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$　　 //匹配正浮點數
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$　 //匹配負浮點數
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$　 //匹配浮點數
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$　　 //匹配非負浮點數（正浮點數 + 0）
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$　　//匹配非正浮點數（負浮點數 + 0）
評註：處理大量資料時有用，具體應用時注意修正

匹配特定字串：
^[A-Za-z]+$　　//匹配由26個英文字母組成的字串
^[A-Z]+$　　//匹配由26個英文字母的大寫組成的字串
^[a-z]+$　　//匹配由26個英文字母的小寫組成的字串
^[A-Za-z0-9]+$　　//匹配由數字和26個英文字母組成的字串
^\w+$　　//匹配由數字、26個英文字母或者下劃線組成的字串

英文字母:[a-zA-Z]

匹配中文，英文字母和數字及_:

^[\u4e00-\u9fa5_a-zA-Z0-9]+$

同時判斷輸入長度：
[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}

^[\w\u4E00-\u9FA5\uF900-\uFA2D]*$ 1、一個正規表示式，只含有漢字、數字、字母、下劃線不能以下劃線開頭和結尾：
^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$ 其中：
^ 與字串開始的地方匹配
(?!_)　　不能以_開頭
(?!.*?_$)　　不能以_結尾
[a-zA-Z0-9_\u4e00-\u9fa5]+　　至少一個漢字、數字、字母、下劃線
$　　與字串結束的地方匹配

放在程式裡前面加@，否則需要\\進行轉義 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$"
（或者：@"^(?!_)\w*(?<!_)$" 或者 @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ " )

2、只含有漢字、數字、字母、下劃線，下劃線位置不限：

^[a-zA-Z0-9_\u4e00-\u9fa5]+$

3、由數字、26個英文字母或者下劃線組成的字串

^\w+$

4、2~4個漢字

@"^[\u4E00-\u9FA5]{2,4}$";

5.最長不得超過7個漢字，或14個位元組(數字，字母和下劃線)正規表示式

^[\u4e00-\u9fa5]{1,7}$|^[\dA-Za-z_]{1,14}$

7.匹配月份的正規表示式

^[1-9]$|^1[0-2]$

注：個位數月份匹配方式前面不能加 0。

^0?[1-9]$|^1[0-2]$

注：個位數月份前可以加0或者不加。

匹配年份19**或者20**

^(19|20)[0-9]{2}$

8.提取html中的超連結。

(]*)(href="https?:\/\/)((?!(?:(?:www\.)?'.implode('|(?:www\.)?',$follow_list).'))[^"]+)"((?!.*\brel=)[^>]*)(?:[^>]*)>

9.提取URL連結

^(f|ht){1}(tp|tps):\/\/([\w-]+\.)+[\w-]+(\/[\w-./?%&=]*)?

一個常用的線上測試工具：http://tool.oschina.net/regex/

正規表示式總結
2019-01-19
Java正規表示式總結
2018-08-22
Java
常用正規表示式總結
2018-09-19
JS正規表示式總結
2018-12-20
JS
javascript正規表示式總結
2017-03-27
JavaScript
正規表示式學習總結
2017-03-20
JavaScript正規表示式方法總結
2016-12-07
JavaScript
正規表示式要點總結
2017-06-27
硬剛正規表示式的心得總結
2018-03-19
正規表示式的\b與\B總結
2017-08-05
php之正規表示式函式總結
2019-02-16
PHP函式
超簡單！正規表示式總結
2020-11-05
擴充正規表示式命令總結
2015-06-01
c# 中常用的正規表示式總結
2014-05-06
C#
正規表示式的多種實用總結
2014-05-06
正規表示式基礎知識總結
2019-01-03
JavaScript學習總結（八）正規表示式
2016-09-16
JavaScript
javascript正規表示式小技巧
2013-07-11
JavaScript
密碼強度的正規表示式（JavaScript）總結
2018-03-09
密碼JavaScript
.NET開發之中的17種正規表示式小結(轉)
2007-08-15
【正規表示式】常用的正規表示式（數字，漢字，字串，金額等的正規表示式）
2021-12-13
字串
匹配正負小數正規表示式程式碼
2017-06-27
正規表示式
2024-10-30
正規表示式中 “$” 並不是表示 “字串結束
2024-04-15
字串
JavaScript的正規表示式
2017-10-21
JavaScript
JS 的正規表示式
2017-09-11
JS
JS常用正規表示式及驗證時間的正規表示式
2022-03-19
JS
python正規表示式小例幾則
2018-08-09
Python
【JavaScript】正規表示式
2019-03-02
JavaScript
php –正規表示式
2019-02-16
PHP
正規表示式教程
2021-09-09
正規表示式 split()
2018-09-07
java正規表示式
2020-11-21
Java
PHP正規表示式
2020-11-11
PHP
javascript正規表示式
2020-11-09
JavaScript
【java】正規表示式
2018-04-05
Java
初探正規表示式
2018-05-11
[js]正規表示式
2017-04-15
JS

正規表示式的小總結

相關文章