javascript快速入門11--正規表示式

水之原發表於2013-12-01

正規表示式可以:

  • 測試字串的某個模式。例如,可以對一個輸入字串進行測試,看在該字串是否存在一個電話號碼模式或一個信用卡號碼模式。這稱為資料有效性驗證
  • 替換文字。可以在文件中使用一個正規表示式來標識特定文字,然後可以全部將其刪除,或者替換為別的文字
  • 根據模式匹配從字串中提取一個子字串。可以用來在文字或輸入欄位中查詢特定文字

正規表示式語法

一個正規表示式就是由普通字元(例如字元 a 到 z)以及特殊字元(稱為元字元)組成的文字模式。該模式描述在查詢文字主體時待匹配的一個或多個字串。正規表示式作為一個模板,將某個字元模式與所搜尋的字串進行匹配。

下表是元字元及其在正規表示式上下文中的行為的一個完整參考列表:

字元描述
\ 轉義字元,在之前,我們在字串也用過這字元,即一些字元具有特殊含義,對其進行轉義使它成為普通字元,而用在普通字元上又表示其有特殊含義
^ 匹配輸入字串的開始位置,如果設定了匹配多行(m),那麼也匹配行的開頭
$ 匹配輸入字串的結束位置。如果設定了匹配多行(m),那麼也匹配行的結束
* 匹配前面的子表示式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。 * 等價於{0,}。
+ 匹配前面的子表示式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價於 {1,}。
? 匹配前面的子表示式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等價於 {0,1}。
{n} n 是一個非負整數。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個 o。
{n,} n 是一個非負整數。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價於 'o+'。'o{0,}' 則等價於 'o*'。
{n,m} mn 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。劉, "o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價於 'o?'。請注意在逗號和兩個數之間不能有空格。
? 當該字元緊跟在任何一個其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 後面時,匹配模式是非貪婪的。非貪婪模式儘可能少的匹配所搜尋的字串,而預設的貪婪模式則儘可能多的匹配所搜尋的字串。例如,對於字串 "oooo",'o+?' 將匹配單個 "o",而 'o+' 將匹配所有 'o'。
. 匹配除 "\n" 之外的任何單個字元。要匹配包括 '\n' 在內的任何字元,請使用象 '[.\n]' 的模式。
(pattern) 匹配pattern 並獲取這一匹配。所獲取的匹配可以從產生的 Matches 集合得到,使用 $0$9 屬性。要匹配圓括號字元,請使用 '\(' 或 '\)'。
(?:pattern) 匹配 pattern 但不獲取匹配結果,也就是說這是一個非獲取匹配,不進行儲存供以後使用。這在使用 "或" 字元 (|) 來組合一個模式的各個部分是很有用。例如, 'industr(?:y|ies) 就是一個比 'industry|industries' 更簡略的表示式。
(?=pattern) 正向預查,在任何匹配 pattern 的字串開始處匹配查詢字串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。例如, 'Windows (?=95|98|NT|2000)' 能匹配 "Windows 2000" 中的 "Windows" ,但不能匹配 "Windows 3.1" 中的 "Windows"。預查不消耗字元,也就是說,在一個匹配發生後,在最後一次匹配之後立即開始下一次匹配的搜尋,而不是從包含預查的字元之後開始。
(?!pattern) 負向預查,在任何不匹配pattern 的字串開始處匹配查詢字串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。例如'Windows (?!95|98|NT|2000)' 能匹配 "Windows 3.1" 中的 "Windows",但不能匹配 "Windows 2000" 中的 "Windows"。預查不消耗字元,也就是說,在一個匹配發生後,在最後一次匹配之後立即開始下一次匹配的搜尋,而不是從包含預查的字元之後開始
x|y 匹配 xy。例如,'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 則匹配 "zood" 或 "food"。
[xyz] 字符集合。匹配所包含的任意一個字元。例如, '[abc]' 可以匹配 "plain" 中的 'a'。
[^xyz] 負值字符集合。匹配未包含的任意字元。例如, '[^abc]' 可以匹配 "plain" 中的'p'。
[a-z] 字元範圍。匹配指定範圍內的任意字元。例如,'[a-z]' 可以匹配 'a' 到 'z' 範圍內的任意小寫字母字元。
[^a-z] 負值字元範圍。匹配任何不在指定範圍內的任意字元。例如,'[^a-z]' 可以匹配任何不在 'a' 到 'z' 範圍內的任意字元。
\b 匹配一個單詞邊界,也就是指單詞和空格間的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
\B 匹配非單詞邊界。'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
\cx 匹配由x指明的控制字元。例如, \cM 匹配一個 Control-M 或回車符。 x 的值必須為 A-Z 或 a-z 之一。否則,將 c 視為一個原義的 'c' 字元。
\d 匹配一個數字字元。等價於 [0-9]。
\D 匹配一個非數字字元。等價於 [^0-9]。
\f 匹配一個換頁符。等價於 \x0c 和 \cL。
\n 匹配一個換行符。等價於 \x0a 和 \cJ。
\r 匹配一個回車符。等價於 \x0d 和 \cM。
\s 匹配任何空白字元,包括空格、製表符、換頁符等等。等價於 [?\f\n\r\t\v]。
\S 匹配任何非空白字元。等價於 [^?\f\n\r\t\v]。
\t 匹配一個製表符。等價於 \x09 和 \cI。
\v 匹配一個垂直製表符。等價於 \x0b 和 \cK。
\w 匹配包括下劃線的任何單詞字元。等價於'[A-Za-z0-9_]'。
\W 匹配任何非單詞字元。等價於 '[^A-Za-z0-9_]'。
\xn 匹配 n,其中 n 為十六進位制轉義值。十六進位制轉義值必須為確定的兩個數字長。例如, '\x41' 匹配 "A"。'\x041' 則等價於 '\x04' & "1"。正規表示式中可以使用 ASCII 編碼。.
\num 匹配 num,其中 num 是一個正整數。對所獲取的匹配的引用。例如,'(.)\1' 匹配兩個連續的相同字元。
\n 標識一個八進位制轉義值或一個後向引用。如果 \n 之前至少 n 個獲取的子表示式,則 n 為後向引用。否則,如果 n 為八進位制數字 (0-7),則 n 為一個八進位制轉義值。
\nm 標識一個八進位制轉義值或一個後向引用。如果 \nm 之前至少有is preceded by at least nm 個獲取得子表示式,則 nm 為後向引用。如果 \nm 之前至少有 n 個獲取,則 n 為一個後跟文字 m 的後向引用。如果前面的條件都不滿足,若? nm 均為八進位制數字 (0-7),則 \nm 將匹配八進位制轉義值 nm
\nml 如果 n 為八進位制數字 (0-3),且 ml 均為八進位制數字 (0-7),則匹配八進位制轉義值 nml。
\un 匹配 n,其中 n 是一個用四個十六進位制數字表示的 Unicode 字元。例如, \u00A9 匹配版權符號 (?)。

建立正規表示式

    var re = new RegExp();//RegExp是一個物件,和Aarray一樣
    //但這樣沒有任何效果,需要將正規表示式的內容作為字串傳遞進去
    re =new RegExp("a");//最簡單的正規表示式,將匹配字母a
    re=new RegExp("a","i");//第二個引數,表示匹配時不分大小寫

 

RegExp建構函式第一個引數為正規表示式的文字內容,而第一個引數則為可選項標誌.標誌可以組合使用

  • g (全文查詢)
  • i (忽略大小寫)
  • m (多行查詢)
    var re = new RegExp("a","gi");//匹配所有的a或A

 

正規表示式還有另一種正規表示式字面量的宣告方式

    var re = /a/gi;

 

和正規表示式相關的方法和屬性

正規表示式物件的方法

  • test,返回一個 Boolean 值,它指出在被查詢的字串中是否存在模式。如果存在則返回 true,否則就返回 false。
  • exec,用正規表示式模式在字串中執行查詢,並返回包含該查詢結果的一個陣列。
  • compile,把正規表示式編譯為內部格式,從而執行得更快。

正規表示式物件的屬性

  • source,返回正規表示式模式的文字的複本。只讀。
  • lastIndex,返回字元位置,它是被查詢字串中下一次成功匹配的開始位置。
  • $1...$9,返回九個在模式匹配期間找到的、最近儲存的部分。只讀。
  • input ($_),返回執行規範表述查詢的字串。只讀。
  • lastMatch ($&),返回任何正規表示式搜尋過程中的最後匹配的字元。只讀。
  • lastParen ($+),如果有的話,返回任何正規表示式查詢過程中最後括的子匹配。只讀。
  • leftContext ($`),返回被查詢的字串中從字串開始位置到最後匹配之前的位置之間的字元。只讀。
  • rightContext ($'),返回被搜尋的字串中從最後一個匹配位置開始到字串結尾之間的字元。只讀。

String物件一些和正規表示式相關的方法

  • match,找到一個或多個正規表示式的匹配。
  • replace,替換與正規表示式匹配的子串。
  • search,檢索與正規表示式相匹配的值。
  • split,把字串分割為字串陣列。

測試正規表示式是如何工作的!

    //test方法,測試字串,符合模式時返回true,否則返回false
    var re = /he/;//最簡單的正規表示式,將匹配he這個單詞
    var str = "he";
    alert(re.test(str));//true
    str = "we";
    alert(re.test(str));//false
    str = "HE";
    alert(re.test(str));//false,大寫,如果要大小寫都匹配可以指定i標誌(i是ignoreCase或case-insensitive的表示)
    re = /he/i;
    alert(re.test(str));//true
    str = "Certainly!He loves her!";
    alert(re.test(str));//true,只要包含he(HE)就符合,如果要只是he或HE,不能有其它字元,則可使用^和$
    re = /^he/i;//脫字元(^)代表字元開始位置
    alert(re.test(str));//false,因為he不在str最開始
    str = "He is a good boy!";
    alert(re.test(str));//true,He是字元開始位置,還需要使用$
    re = /^he$/i;//$表示字元結束位置
    alert(re.test(str));//false
    str = "He";
    alert(re.test(str));//true
    //當然,這樣不能發現正規表示式有多強大,因為我們完全可以在上面的例子中使用==或indexOf
    re = /\s/;// \s匹配任何空白字元,包括空格、製表符、換頁符等等
    str= "user Name";//使用者名稱包含空格
    alert(re.test(str));//true
    str = "user        Name";//使用者名稱包含製表符
    alert(re.test(str));//true
    re=/^[a-z]/i;//[]匹配指定範圍內的任意字元,這裡將匹配英文字母,不區分大小寫
    str="variableName";//變數名必須以字母開頭
    alert(re.test(str));//true
    str="123abc";
    alert(re.test(str));//false

 

當然,僅僅知道了字串是否匹配模式還不夠,我們還需要知道哪些字元匹配了模式

    var osVersion = "Ubuntu 8";//其中的8表示系統主版本號
    var re = /^[a-z]+\s+\d+$/i; //+號表示字元至少要出現1次,\s表示空白字元,\d表示一個數字
    alert(re.test(osVersion));//true,但我們想知道主版本號
    //另一個方法exec,返回一個陣列,陣列的第一個元素為完整的匹配內容
    re=/^[a-z]+\s+\d+$/i;
    arr = re.exec(osVersion);
    alert(arr[0]);//將osVersion完整輸出,因為整個字串剛好匹配re
    //我只需要取出數字
    re=/\d+/;
    var arr = re.exec(osVersion);
    alert(arr[0]);//8

 

更復雜的用法,使用子匹配

    //exec返回的陣列第1到n元素中包含的是匹配中出現的任意一個子匹配
    re=/^[a-z]+\s+(\d+)$/i;//用()來建立子匹配
    arr =re.exec(osVersion);
    alert(arr[0]);//整個osVersion,也就是正規表示式的完整匹配
    alert(arr[1]);//8,第一個子匹配,事實也可以這樣取出主版本號
    alert(arr.length);//2
    osVersion = "Ubuntu 8.10";//取出主版本號和次版本號
    re = /^[a-z]+\s+(\d+)\.(\d+)$/i;//.是正規表示式元字元之一,若要用它的字面意義須轉義
    arr = re.exec(osVersion);
    alert(arr[0]);//完整的osVersion
    alert(arr[1]);//8
    alert(arr[2]);//10

 

注意,當字串不匹配re時,exec方法將返回null

String物件的一些和正規表示式有關的方法

    //replace方法,用於替換字串
    var str ="some money";
    alert(str.replace("some","much"));//much money
    //replace的第一個引數可以為正規表示式
    var re = /\s/;//空白字元
    alert(str.replace(re,"%"));//some%money
    //在不知道字串中有多少空白字元時,正規表示式極為方便
    str ="some some             \tsome\t\f";
    re = /\s+/;
    alert(str.replace(re,"#"));//但這樣只會將第一次出現的一堆空白字元替換掉
    //因為一個正規表示式只能進行一次匹配,\s+匹配了第一個空格後就退出了
    re = /\s+/g;//g,全域性標誌,將使正規表示式匹配整個字串
    alert(str.replace(re,"@"));//some@some@some@
    //另一個與之相似的是split
    var str = "a-bd-c";
    var arr = str.split("-");//返回["a","bd","c"]
    //如果str是使用者輸入的,他可能輸入a-bd-c也可能輸入a bd c或a_bd_c,但不會是abdc(這樣就說他輸錯了)
    str = "a_db-c";//使用者以他喜歡的方式加分隔符s
    re=/[^a-z]/i;//前面我們說^表示字元開始,但在[]裡它表示一個負字符集
    //匹配任何不在指定範圍內的任意字元,這裡將匹配除字母處的所有字元
    arr = str.split(re);//仍返回["a","bd","c"];
    //在字串中查詢時我們常用indexOf,與之對應用於正則查詢的方法是search
    str = "My age is 18.Golden age!";//年齡不是一定的,我們用indexOf不能查詢它的位置
    re = /\d+/;
    alert(str.search(re));//返回查詢到的字串開始下標10
    //注意,因為查詢本身就是出現第一次就立即返回,所以無需在search時使用g標誌
    //下面的程式碼雖然不出錯,但g標誌是多餘的
    re=/\d+/g;
    alert(str.search(re));//仍然是10

 

注意,當search方法沒有找到匹配時,將返回-1

類似於exec方法,String物件的match方法也用於將字串與正規表示式進行匹配並返回結果陣列

    var str = "My name is CJ.Hello everyone!";
    var re = /[A-Z]/;//匹配所有大寫字母
    var arr = str.match(re);//返回陣列
    alert(arr);//陣列中只會包含一個M,因為我們沒有使用全域性匹配
    re = /[A-Z]/g;
    arr = str.match(re);
    alert(arr);//M,C,J,H
    //從字串中抽取單詞
    re = /\b[a-z]\b/i;//\b表示單詞邊界
    str = "one two three four";
    alert(str.match(re));//one,two,three,four

 

RegExp物件例項的一些屬性

    var re = /[a-z]/i;
    alert(re.source);//將[a-z]字串輸出
    //請注意,直接alert(re)會將正規表示式連同前向斜線與標誌輸出,這是re.toString方法定義的

 

每個RegExp物件的例項具有lastIndex屬性,它是被查詢字串中下一次成功匹配的開始位置,預設值是-1。 lastIndex 屬性被 RegExp 物件的 exec 和 test 方法修改.並且它是可寫的.

    var re = /[A-Z]/;
    //exec方法執行後,修改了re的lastIndex屬性,
    var str = "Hello,World!!!";
    var arr = re.exec(str);
    alert(re.lastIndex);//0,因為沒有設定全域性標誌
    re = /[A-Z]/g;
    arr = re.exec(str);
    alert(re.lastIndex);//1
    arr = re.exec(str);
    alert(re.lastIndex);//7

 

當匹配失敗(後面沒有匹配),或lastIndex值大於字串長度時,再執行exec等方法會將lastIndex設為0(開始位置)

    var re = /[A-Z]/;
    var str = "Hello,World!!!";
    re.lastIndex = 120;
    var arr = re.exec(str);
    alert(re.lastIndex);//0

 

RegExp物件的靜態屬性

    //input 最後用於匹配的字串(傳遞給test,exec方法的字串)
    var re = /[A-Z]/;
    var str = "Hello,World!!!";
    var arr = re.exec(str);
    alert(RegExp.input);//Hello,World!!!
    re.exec("tempstr");
    alert(RegExp.input);//仍然是Hello,World!!!,因為tempstr不匹配
    //lastMatch 最後匹配的字元
    re = /[a-z]/g;
    str = "hi";
    re.test(str);
    alert(RegExp.lastMatch);//h
    re.test(str);
    alert(RegExp["$&"]);//i  ,$&是lastMatch的短名字,但由於它不是合法變數名,所以要。。
    //lastParen 最後匹配的分組
    re = /[a-z](\d+)/gi;
    str = "Class1 Class2 Class3";
    re.test(str);
    alert(RegExp.lastParen);//1
    re.test(str);
    alert(RegExp["$+"]);//2
    //leftContext  返回被查詢的字串中從字串開始位置到最後匹配之前的位置之間的字元
    //rigthContext 返回被搜尋的字串中從最後一個匹配位置開始到字串結尾之間的字元
    re = /[A-Z]/g;
    str = "123ABC456";
    re.test(str);
    alert(RegExp.leftContext);//123
    alert(RegExp.rightContext);//BC456
    re.test(str);
    alert(RegExp["$`"]);//123A
    alert(RegExp["$'"]);//C456

 

multiline屬性返回正規表示式是否使用多行模式,這個屬性不針對某個正規表示式例項,而是針對所有正規表示式,並且這個屬性可寫.(IE與Opera不支援這個屬性)

    alert(RegExp.multiline);
    //因為IE,Opera不支援這個屬性,所以最好還是單獨指定
    var re = /\w+/m;
    alert(re.multiline);
    alert(RegExp["$*"]);//RegExp物件的靜態屬性不會因為給RegExp某個物件例項指定了m標誌而改變
    RegExp.multiline = true;//這將開啟所有正規表示式例項的多行匹配模式
    alert(RegExp.multiline);

 

正規表示式高階篇

使用元字元注意事項:元字元是正規表示式的一部分,當我們要匹配正規表示式本身時,必須對這些元字元轉義.下面是正規表示式用到的所有元字元

( [ { \ ^ $ | ) ? * + .

    var str = "?";
    var re = /?/;
    alert(re.test(str));//出錯,因為?是元字元,必須轉義
    re = /\?/;
    alert(re.test(str));//true

 

使用RegExp建構函式與使用正規表示式字面量建立正規表示式注意點

    var str = "\?";
    alert(str);//只會輸出?
    var re = /\?/;//將匹配?
    alert(re.test(str));//true
    re = new RegExp("\?");//出錯,因為這相當於re = /\?/
    re = new RegExp("\\?");//正確,將匹配?
    alert(re.test(str));//true

 

既然雙重轉義這麼不友好,所以還是用正規表示式字面量的宣告方式

如何在正規表示式中使用特殊字元?

    //ASCII方式用十六進位制數來表示特殊字元
    var re = /^\x43\x4A$/;//將匹配CJ
    alert(re.test("CJ"));//true
    //也可使用八進位制方式
    re = /^\103\112$/;//將匹配CJ
    alert(re.test("CJ"));//true
    //還可以使用Unicode編碼
    re =/^\u0043\u004A$/;//使用 Unicode,必須使用u開頭,接著是字元編碼的四位16進製表現形式
    alert(re.test("CJ"));

 

另處,還有一些其它的預定義特殊字元,如下表所示:

字元描述
\n 換行符
\r 回車符
\t 製表符
\f 換頁符(Tab)
\cX 與X對應的控制字元
\b 退格符(BackSpace)
\v 垂直製表符
\0 空字元("")

字元類 ---〉簡單類,反向類,範圍類,組合類,預定義類

    //簡單類
    var re = /[abc123]/;//將匹配abc123這6個字元中一個
    //負向類
    re = /[^abc]/;//將匹配除abc之外的一個字元
    //範圍類
    re = /[a-b]/;//將匹配小寫a-b 26個字母
    re = /[^0-9]/;//將匹配除0-9 10個字元之處的一個字元
    //組合類
    re = /[a-b0-9A-Z_]/;//將匹配字母,數字和下劃線

 

下面是正規表示式中的預定義類

程式碼等同於匹配
. IE下[^\n],其它[^\n\r] 匹配除換行符之外的任何一個字元
\d [0-9] 匹配數字
\D [^0-9] 匹配非數字字元
\s [ \n\r\t\f\x0B] 匹配一個空白字元
\S [^ \n\r\t\f\x0B] 匹配一個非空白字元
\w [a-zA-Z0-9_] 匹配字母數字和下劃線
\W [^a-zA-Z0-9_] 匹配除字母數字下劃線之外的字元

量詞

程式碼描述
* 匹配前面的子表示式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。 * 等價於{0,}。
+ 匹配前面的子表示式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價於 {1,}。
? 匹配前面的子表示式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等價於 {0,1}。
{n} n 是一個非負整數。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個 o。
{n,} n 是一個非負整數。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價於 'o+'。'o{0,}' 則等價於 'o*'。
{n,m} mn 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。劉, "o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價於 'o?'。請注意在逗號和兩個數之間不能有空格。

貪婪量詞與惰性量詞

  • 用貪婪量詞進行匹配時,它首先會將整會字串當成一個匹配,如果匹配的話就退出,如果不匹配,就截去最後一個字元進行匹配,如果不匹配,繼續將最後一個字元截去進行匹配,直到有匹配為止。直到現在我們遇到的量詞都是貪婪量詞
  • 用貪婪量詞進行匹配時,它首先將第一個字元當成一個匹配,如果成功則退出,如果失敗,則測試前兩個字元,依些增加,直到遇到合適的匹配為止
貪婪惰性
+ +?
? ??
* *?
{n} {n}?
{n,} {n,}?
{n,m} {n,m}
    var str = "abc";
    var re = /\w+/;//將匹配abc
    re = /\w+?/;//將匹配a

 

多行模式

    var re = /[a-z]$/;
    var str = "ab\ncdef";
    alert(str.replace(re,"#"));//ab\ncde#
    re =/[a-z]$/m;
    alert(str.replace(re,"#"));//a#\ncde#

 

分組與非捕獲性分組

    re = /abc{2}/;//將匹配abcc
    re = /(abc){2}/;//將匹配abcabc
    //上面的分組都是捕獲性分組
    str = "abcabc ###";
    arr = re.exec(str);
    alert(arr[1]);//abc
    //非捕獲性分組 (?:)
    re = /(?:abc){2}/;
    arr = re.exec(str);
    alert(arr[1]);//undefined

 

候選(也就是所說的“或”)

    re = /^a|bc$/;//將匹配開始位置的a或結束位置的bc
    str ="add";
    alert(re.test(str));//true
    re = /^(a|bc)$/;//將匹配a或bc
    str ="bc";
    alert(re.test(str));//true

 

當包含分組的正規表示式進行過test,match,search這些方法之後,每個分組都被放在一個特殊的地方以備將來使用,這些儲存是分組中的特殊值,我們稱之為反向引用

    var re = /(A?(B?(C?)))/;
    /*上面的正規表示式將依次產生三個分組
    (A?(B?(C?))) 最外面的
    (B?(C?))
    (C?)*/
    str = "ABC";
    re.test(str);//反向引用被儲存在RegExp物件的靜態屬性$1—$9中
    alert(RegExp.$1+"\n"+RegExp.$2+"\n"+RegExp.$3);
    //反向引用也可以在正規表示式中使用\1 ,\2...這類的形式使用
    re = /\d+(\D)\d+\1\d+/;
    str = "2008-1-1";
    alert(re.test(str));//true
    str = "2008-4_3";
    alert(re.test(str));//false

 

使用反向引用可以要求字串中某幾個位置上的字元必須相同.另外,在replace這類方法可,存在特殊字元序列來表示反向引用的方式

    re = /(\d)\s(\d)/;
    str = "1234 5678";
    alert(str.replace(re,"$2 $1"));//在這個裡面$1表示第一個分組1234,$2則表示5678

 

其它——〉正向前瞻,用來捕獲出現在特定字元之前的字元,只有當字元後面跟著某個特定字元才去捕獲它。與正向前瞻對應的有負向前瞻,它用匹配只有當字元後面不跟著某個特定字元時才去匹配它。在執行前瞻和負向前瞻之類的運算時,正規表示式引擎會留意字串後面的部分,然而卻不移動index

    //正向前瞻
    re = /([a-z]+(?=\d))/i;
    //我們要匹配後面跟一個數字的單詞,然後將單詞返回,而不要返回數字
    str = "abc every1 abc";
    alert(re.test(str));//true
    alert(RegExp.$1);//every
    alert(re.lastIndex);//使用前瞻的好處是,前瞻的內容(?=\d)並不會當成一次匹配,下次匹配仍從它開始
    //負向前瞻(?!)
    re = /([a-z](?!\d))/;i
    //將匹配後面不包含數字的字母,並且不會返回(?!\d)中的內容
    str = "abc1 one";
    alert(re.test(str));
    alert(RegExp.$1);//one

 

構建一個驗證電子郵箱地址有效性的正規表示式。電子郵箱地址有效性要求(我們姑且這樣定義):使用者名稱只能包含字母數字以及下劃線,最少一位,最多25位,使用者名稱後面緊跟@,後面是域名,域名名稱要求只能包含字母數字和減號(-),並且不能以減號開頭或結尾,然後後面是域名字尾(可以有多個),域名字尾必須是點號連上2-4位英文字母

    var re = /^\w{1,15}(?:@(?!-))(?:(?:[a-z0-9-]*)(?:[a-z0-9](?!-))(?:\.(?!-)))+[a-z]{2,4}$/;

 

相關文章