在此之前的專案開發中,發現利用正則方法能夠提高開發效率,所以看著教程和部落格,自己重新學習了一遍正則,並記錄下來。
正則宣告
- 建構函式宣告方式
var pat = new RegExp(pattern,modifiers);
- 字面量宣告方式
var pat = /pattern/modifiers
- tip:引數解釋:
pattern:模式,要匹配的內容。
modifiers:修飾符- i:ignore。不區分大小寫的匹配
- g:global。全域性匹配
- m:多行匹配
ps:這三個可以連用,無順序之分。
var reg = new RegExp(`abc`,`ig`); // 代表不區分大小寫並且全域性匹配abc。 var reg = /abc/m // 代表多行匹配abc。
正則字元
- ^ 表示匹配輸入字串的開始位置
^abc => 代表整個字元中匹配首個字串為abc的
- $ 表示匹配輸入字串的結束位置
abc$ => 代表整個字元中匹配尾部字串為abc的
- . 表示匹配換行符
之外的任何字元
. <=> wd
f v
ps:[.] 這種模式代表只匹配.字元,等價於`.` - [] 表示字符集合。匹配所包含的任意一個字元
[abc] => apple也符合[abc]中的a
[abcdef] => football也符合[abcdef]的a,b,f
[^abc] => 代表不包含abc的任何字元都可匹配
ps: ^abc與[^abc]的區別:- ^abc 代表整個字元中匹配首個字串為abc的
- [^abc] 代表不包含abc的任何字元都可匹配
- {} 表示匹配字元的數量,量詞
a{2} => 代表匹配確定a只能出現兩次
- {n} 匹配確定的n次
a{2} => 代表匹配確定a只能出現兩次 aa
- {n,} 表示至少匹配n次
a{2,} => 代表匹配確定a至少出現兩次 aa,aaa,aaaa
- {m,n} 表示最少出現m次,最多出現n次
a{2,4} => 代表匹配確定a最少出現2次,最多出現4次 aa,aaa,aaaa
- {n} 匹配確定的n次
- | 表示或的關係,兩者都可匹配
a|b => 代表a和b都可以匹配到
- () 表示分組符,一代表匹配裡面的字元並獲取這一匹配。二代表優先順序
(partten) => 匹配pattern並獲取這一匹配
^(0|[1-9][0-9]*)$ => 代表零和非零開頭的數字
ps:(?:pattern) => 匹配pattern但不獲取匹配結果。 - + 表示前面的字元必須至少出現一次(1次或多次)
a+bc <=> abc | aabc | aaabc
ps:+ 等價於 {1,} - * 表示字元可以不出現,也可以出現1次或多次
a*bc <=> bc | abc | aabc
ps: * 等價於 {0,} - ? 表示前面的字元最多隻可以出現一次(0次或1次)
a?bc <=> bc | abc
常用字元和非列印字元
- d 匹配一個數字字元
d 等價於 [0-9] (d <=> [0-9]
) - D 匹配一個非數字字元
D 等價於 [^abc] (D <=> [^0-9]
) - w 匹配字母,數字,下劃線
w <=> [A-Za-z0-9_]
- W 匹配非字母,數字,下劃線
W <=> [^A-Za-z0-9_]
- 匹配一個單詞邊界,也就是單詞和空格間的位置
- B 匹配一個非單詞邊界
eg: /ter/ => 可匹配chapter,不能匹配terminal - 換行符
- 回車符
- f 換頁符
- 製表符
- v 垂直製表符
- s 匹配任何空白字元,包括空格,製表符,換頁符
s <=> [f
v
] - S 匹配任何非空白字元
S <=> [^f
v ]
正則方法
var reg = new RegExp()
var str = `abc`; typeof str == `string`
-
reg.test(str); 用來測試某個字串是否與正則匹配,返回值是一個布林值,匹配為true,不匹配為false。
var reg = /^a?b+c*/ var str1 = `aabbcc` var str2 = `bc` reg.test(str1) // false ?代表的是最多出現一次 reg.test(str2) // true
-
reg.compile(str) 能夠對正規表示式進行編譯,方便多次呼叫,提高效能。參考菜鳥教程的說法:
該方法可以編譯指定的正規表示式,編譯之後的正規表示式執行速度將會提高,如果正規表示式多次被呼叫,那麼呼叫compile方法可以有效的提高程式碼的執行速度,如果該正規表示式只能被使用一次,則不會有明顯的效果。
var str="Every man in the world! Every woman on earth!"; patt=/man/g; str2=str.replace(patt,"person"); console.log(str2); // Every person in the world! Every woperson on earth! patt=/(wo)?man/g; patt.compile(patt); str2=str.replace(patt,"person"); console.log(str2); // Every person in the world! Every person on earth!
-
reg.exec(str) 接受一個字串,返回一個陣列,否則返回null。
返回值是陣列 解釋:
1 如果有多個匹配的話
1 此陣列的第0個元素是與正規表示式相匹配的文字。
2 第一個元素是與reg的第一個子表示式相匹配的文字,(如果有的話)
3 第二個元素是reg的第二個子表示式相匹配的文字,(如果有的話)
4……
2 index 匹配文字的第一個字元的索引
3 input 是被檢索的字串strvar str = `2018ceshi2019` var reg = /(d)(w)/; var result = reg.exec(str) console.log(result);//["20", "2", "0", index: 0, input: "2018ceshi2019"]
var str = `The Quick Brown Fox Jumps Over The Lazy Dog` var reg = /quicks(brown).+?(jumps)/ig; var result = reg.exec(str); console.log(result); // ["Quick Brown Fox Jumps", "Brown", "Jumps", index: 4, input: "The Quick Brown Fox Jumps Over The Lazy Dog", groups: undefined] // result [0] 匹配的全部字串 `Quick Brown Fox Jumps` // [1],[2],...[n] 括號中的分組捕獲 [1] = Brown [2] = Jumps // index :匹配到的字元位於原始字串的基於0的索引值 4 // input : 原始字串 The Quick Brown Fox Jumps Over The Lazy Dog
ps:如果不需要捕獲分佈的內容,則在不需要分組捕獲裡面加上?:,此表示匹配不捕獲。
var reg = /quicks(?:brown).+?(?;jumps)/ig;
這樣就不會有[1],[2],…[n]的分組捕獲了。 -
str.match(reg) 在字串中搜尋符合規則的內容,成功則返回陣列內容,失敗則返回null
var str = `abc123def45g6hijkl789`; var reg1 = /d+/g; // 每次匹配至少一個數字 且全域性匹配 console.log( str.match(reg1)); // [123,45,6,789] var reg2 = /d+/; console.log(str.match(reg2)); // ["123", index: 3, input: "abc123def45g6hijkl789", groups: undefined] var reg3 = /d/; console.log(str.match(reg3));//["1", index: 3, input: "abc123def45g6hijkl789", groups: undefined] var reg4 = /d/g; console.log(str.match(reg4)) // ["1", "2", "3", "4", "5", "6", "7", "8", "9"]
由這四個例子可知,全域性匹配,得出的結果是一個陣列,如果不是全域性匹配,當找到數字123,它就會停止了。就只會彈出123,類似與exec()的結果。加上全域性匹配,就會從開始到結束一直去搜尋符合規則的。如果沒有加號,匹配的結果就是[“1”, “2”, “3”, “4”, “5”, “6”, “7”, “8”, “9”],有了加號,每次匹配的數字就是至少一個了。
-
str.search(reg) 在字串中搜尋符合正則內容的索引,如果不存在,則返回-1。
var str = `abcdefg`; var reg1 = /B/i; console.log(str.search(reg1)) // 1 var reg2 = /B/; console.log(str.search(reg2)) // -1
-
str.replace(reg,new str/callback)
引數解釋: 第一個引數reg:要匹配的正則內容,
第二個引數new str/callback。callback,回撥函式裡也有三個引數:1 匹配的字元,2 匹配字元的索引,3 源字串。var str = `我愛北京天安門,天安門上太陽升` var reg = /北京|天安門/g console.log(str.replace(reg,`*`)) // 我愛**,*上太陽升
var str = "我愛北京天安門,天安門上太陽升。"; var re = /北京|天安門/g; // 找到北京 或者天安門 全域性匹配 var str2 = str.replace(re,function(str){ console.log(str); //用來測試:函式的第一個引數代表每次搜尋到的符合正則的字元,所以第一次str指的是北京 第二次str是天安門 第三次str是天安門 var result = ``; for(var i=0;i<str.length;i++){ result += `*`; } return result; //所以搜尋到了幾個字就返回幾個* }); console.log(str2) //我愛*****,***上太陽升
額外例子:
-
1 找重複項最多的字元個數
var str = `aibbicidhdieifigbdihdaii`; var arr = str.split(``); //把字串轉換為陣列 str = arr.sort().join(``); //首先進行排序,這樣結果會把相同的字元放在一起,然後再轉換為字串 console.log(str); // aabbbcddddefghhiiiiiiiii var value = ``; var index = 0; var re = /(w)1+/g; //匹配字元,且重複這個字元,重複次數至少一次。 str.replace(re,function($0,$1){ console.log($0); //代表每次匹配成功的結果 : aa dd jj kk l sssssssssssssssss console.log($1); //代表每次匹配成功的第一個子項,也就是w: a d j k l S if(index<$0.length){ //如果index儲存的值小於$0的長度就進行下面的操作 index = $0.length; // 這樣index一直儲存的就在最大的長度 value = $1; //value儲存的是出現最多的這個字元 } }); console.log(`最多的字元:`+value+`,重複的次數:`+index); // 最多的字元:i,重複的次數:9
-
大寫數字替換小寫數字
var str = "2019"; var a = ["零","壹","貳","叄","肆","伍","陸","柒","捌","玖"]; str = str.replace(/d/g, function () { return a[arguments[0]]; }); console.log(str);//貳零壹玖
結尾
通過學習正則,發現正則不是很難,主要是因為沒有往正則方面去想,正則無非就是幾個字元加上方法就能匹配自己想要匹配的結果,在於嘗試,嘗試多了,自然而然就學會合理在專案中使用正則。
以上是我學習正則記錄的筆記,我把筆記整理到了github上了,歡迎閱讀,好的話給個star。大家如果覺得我有什麼做的不對的,請下方評論或私信,一起進步加油!參考資料