js正規表示式

var reg = /\bare\b/g;複製程式碼

var reg = new RegExp('\\bare\\b','g');複製程式碼

若只想替換“This”中的is，觀察發現：前邊不是邊界，後面才是邊界，於是有

var reg1 = /\w/;
var reg2 = /\w/gim;複製程式碼

var reg1 = /\w/;
var reg2 = /\w/g;複製程式碼

var reg1 = /\w/;
var reg2 = /\w/g;
while(reg2.test('ab')){
    console.log(reg2.lastIndex);
}複製程式碼

js正規表示式

很多時候，我們對正規表示式的印象都是難學難記，學了又忘，忘了又學，但總覺得記不住。

什麼是正規表示式？

正規表示式(Regular Expression)使用單個字元來描述、匹配一系列符合某個句法規則的字串。

使用正規表示式的目的--替換工作。自己先定義一種規則，然後到字串中去匹配一下符合這個規則的子字串。

為了更好地理解正規表示式，我們可藉助視覺化工具，線上地址為：

先學習一下正規表示式的語法：

1、RegExp物件

js通過內建物件RegExp支援正規表示式，有2種方法例項化RegExp物件： a.字面量 b.建構函式

a.字面量

如何進行全文匹配？☞“g”

b.建構函式

第1個引數：字串☞正規表示式的文字，js中“\”本身就是特殊字元，想使用的話需要轉義；

第2個引數：字串☞標識。

全文匹配-->“g”：

修飾符

g：global--全文搜尋，不新增，搜尋到第一個匹配為止；

i：ignore case--忽略大小寫，預設大小寫敏感；

m：multiple lines--多行搜尋。

發現：大寫的單詞未被替換，想要忽略大小寫，無論大小寫都能匹配☞“i”。

2、元字元

正規表示式由2種基本字元型別組成：1.原義文字字元， 2.元字元

元字元是在正規表示式中有特殊含義的非字母字元

* + ? $ ^ . | \ () {} []

3、字元類

一般情況下，正規表示式的一個字元對應字串的一個字元。有時，希望匹配某類字元(即符合一系列特徵的某類字元)，該如何處理？

☞我們可以使用元字元[]來構建一個簡單的類；

☞所謂類是指符合某些特性的物件，是一個泛指，而不是特指某個字元；

☞表示式[abc]把字元a或b或c歸為一類，表示式可以匹配這類的字元。

字元類取反

a.使用元字元^建立反向類/負向類

b.反向類是指不屬於某類的內容

c.表示式[^abc]表示不是字元a或b或c的內容

4、範圍類

使用字元類匹配數字[0123456789]

可使用[a-z]來連線2個字元，表示從a到z的任意字元(這是個閉區間，即包含a和z本身)。

在[]組成的類內部是可以連寫的[a-zA-Z]

問：“-”並不是特殊字元，也不是元字元，有時在類裡就想要匹配“-”時該如何？

記住：“-”在中間，即一個開頭，一個結尾這樣的語法裡，表示範圍。

這樣就可匹配“-”了。

5、預定義類

匹配一個 ab+數字+任意字元 的字串

正規表示式還提供了幾個常用的邊界匹配符

發現：凡有“is”的地方都做了替換。

只想替換單詞“is”，單詞是有單詞邊界的。

注意：元字元的含義並不是唯一的，在不同的場景下有不同的含義，不在[]裡的含義就不是取反了，而是表示“以xx開始”。

“.@”☞“任意字元+@”進行匹配

“@.”☞“@+任意字元”進行匹配

“.@$”☞“只想讓@作為結尾”進行匹配

6、量詞

我們希望匹配一個連續出現n次數字的字串，如“\d\d\d\d\d\d\d\d\d\d......”，為了解決這樣的問題，正規表示式引入了量詞的概念。

7、正規表示式的貪婪模式與非貪婪模式

a.貪婪模式

正規表示式在匹配時會儘可能多地匹配，直到匹配失敗，預設是貪婪模式。

b.非貪婪模式

讓正規表示式儘可能少地匹配，即一旦匹配成功就不再繼續往下，這就是非貪婪模式。☞在量詞後面加?即可。

8、分組

匹配字串javascript連續出現3次的場景，若這樣寫javascript{3}，如下

量詞只能針對於緊挨著它的字母，並不能作為整個單詞。使用( )可達到分組的功能，使量詞作用於分組。

(javascript){3}，如下

使用 | 可達到或的效果：

反向引用

2017-11-10 =>11/10/2017

替換的內容不再是常量，而是變數，此時該如何處理？☞“$”分組類的內容。

用"$1"等來代表捕獲的分組，又叫分組捕獲。

利用分組，但又不想捕獲它，該如何？☞忽略分組

不希望捕獲某些分組，只需要在分組內加上? :即可。

9、前瞻

正規表示式從文字頭部向尾部開始解析，文字尾部方向，稱為“前”，文字頭部，稱為“後”。

前瞻就是在正規表示式匹配到規則時，向前檢查是否符合斷言，後顧/後瞻方向反。

js不支援後顧。

符合特定斷言稱為肯定/正向匹配；不符合特定斷言稱為否定/負向匹配。

10、js物件屬性

global：是否全文搜尋，預設false。

ignore case：是否大小寫敏感，預設false。

multiline：多行搜尋，預設false。

lastIndex：是當前表示式匹配內容的最後一個字元的下一個位置。

source：正則表示式的文字字串。

RegExp.prototype.test(str)☞用於測試字串引數中是否存在匹配正規表示式模式的字串。若存在則返回true，否則返回false。

產生原因：受lastIndex影響。

匹配一個 ab+數字+任意字元的字串