徹底理解正則

熱愛前端的17號誒發表於2019-02-12

原文網址 : https://flycode.co/archives/239141

在此之前的專案開發中，發現利用正則方法能夠提高開發效率，所以看著教程和部落格，自己重新學習了一遍正則，並記錄下來。

正則宣告

建構函式宣告方式
var pat = new RegExp(pattern,modifiers);
字面量宣告方式
var pat = /pattern/modifiers
tip:引數解釋：
pattern：模式，要匹配的內容。
modifiers：修飾符
- i：ignore。不區分大小寫的匹配
- g：global。全域性匹配
- m：多行匹配
  ps：這三個可以連用，無順序之分。
```
var reg = new RegExp(`abc`,`ig`); // 代表不區分大小寫並且全域性匹配abc。
var reg = /abc/m  // 代表多行匹配abc。
```

正則字元

^ 表示匹配輸入字串的開始位置
^abc => 代表整個字元中匹配首個字串為abc的
$ 表示匹配輸入字串的結束位置
abc$ => 代表整個字元中匹配尾部字串為abc的
. 表示匹配換行符
之外的任何字元
. <=> wd f v
ps：[.] 這種模式代表只匹配.字元，等價於`.`
[] 表示字符集合。匹配所包含的任意一個字元
[abc] => apple也符合[abc]中的a
[abcdef] => football也符合[abcdef]的a,b,f
[^abc] => 代表不包含abc的任何字元都可匹配
ps: ^abc與[^abc]的區別：
- ^abc 代表整個字元中匹配首個字串為abc的
- [^abc] 代表不包含abc的任何字元都可匹配
{} 表示匹配字元的數量，量詞
a{2} => 代表匹配確定a只能出現兩次
- {n} 匹配確定的n次
  a{2} => 代表匹配確定a只能出現兩次 aa
- {n,} 表示至少匹配n次
  a{2,} => 代表匹配確定a至少出現兩次 aa,aaa,aaaa
- {m,n} 表示最少出現m次，最多出現n次
  a{2,4} => 代表匹配確定a最少出現2次，最多出現4次 aa,aaa,aaaa
| 表示或的關係，兩者都可匹配
a|b => 代表a和b都可以匹配到
() 表示分組符，一代表匹配裡面的字元並獲取這一匹配。二代表優先順序
(partten) => 匹配pattern並獲取這一匹配
^(0|[1-9][0-9]*)$ => 代表零和非零開頭的數字
ps：(?:pattern) => 匹配pattern但不獲取匹配結果。
+ 表示前面的字元必須至少出現一次(1次或多次)
a+bc <=> abc | aabc | aaabc
ps:+ 等價於 {1,}
* 表示字元可以不出現，也可以出現1次或多次
a*bc <=> bc | abc | aabc
ps: * 等價於 {0,}
? 表示前面的字元最多隻可以出現一次(0次或1次)
a?bc <=> bc | abc

常用字元和非列印字元

d 匹配一個數字字元
d 等價於 [0-9] (d <=> [0-9])
D 匹配一個非數字字元
D 等價於 [^abc] (D <=> [^0-9])
w 匹配字母，數字，下劃線
w <=> [A-Za-z0-9_]
W 匹配非字母，數字，下劃線
W <=> [^A-Za-z0-9_]
匹配一個單詞邊界，也就是單詞和空格間的位置
B 匹配一個非單詞邊界
eg: /ter/ => 可匹配chapter，不能匹配terminal
換行符
回車符
f 換頁符
製表符
v 垂直製表符
s 匹配任何空白字元，包括空格，製表符，換頁符
s <=> [f v ]
S 匹配任何非空白字元
S <=> [^f v ]

正則方法

var reg = new RegExp()
var str = `abc`; typeof str == `string`

reg.test(str); 用來測試某個字串是否與正則匹配，返回值是一個布林值，匹配為true，不匹配為false。

  var reg = /^a?b+c*/
  var str1 = `aabbcc`
  var str2 = `bc`
  reg.test(str1) // false  ？代表的是最多出現一次
  reg.test(str2) // true

reg.compile(str) 能夠對正規表示式進行編譯，方便多次呼叫，提高效能。參考菜鳥教程的說法：該方法可以編譯指定的正規表示式，編譯之後的正規表示式執行速度將會提高，如果正規表示式多次被呼叫，那麼呼叫compile方法可以有效的提高程式碼的執行速度，如果該正規表示式只能被使用一次，則不會有明顯的效果。
```
  var str="Every man in the world! Every woman on earth!";
  patt=/man/g;
  str2=str.replace(patt,"person");
  console.log(str2); // Every person in the world! Every woperson on earth!

  patt=/(wo)?man/g;
  patt.compile(patt);
  str2=str.replace(patt,"person");
  console.log(str2); // Every person in the world! Every person on earth!
```

reg.exec(str) 接受一個字串，返回一個陣列，否則返回null。
返回值是陣列解釋：
1 如果有多個匹配的話
       1 此陣列的第0個元素是與正規表示式相匹配的文字。
       2 第一個元素是與reg的第一個子表示式相匹配的文字，（如果有的話）
       3 第二個元素是reg的第二個子表示式相匹配的文字，（如果有的話）
       4……
2 index 匹配文字的第一個字元的索引
3 input 是被檢索的字串str

  var str = `2018ceshi2019`
  var reg = /(d)(w)/;
  var result = reg.exec(str)
  console.log(result);//["20", "2", "0", index: 0, input: "2018ceshi2019"]

  var str = `The Quick Brown Fox Jumps Over The Lazy Dog`
  var reg = /quicks(brown).+?(jumps)/ig;
  var result = reg.exec(str);
  console.log(result); //  ["Quick Brown Fox Jumps", "Brown", "Jumps", index: 4, input: "The Quick Brown Fox Jumps Over The Lazy Dog", groups: undefined]
  // result [0] 匹配的全部字串 `Quick Brown Fox Jumps` 
  //        [1],[2],...[n] 括號中的分組捕獲 [1] = Brown [2] = Jumps 
  //        index :匹配到的字元位於原始字串的基於0的索引值 4
  //        input : 原始字串 The Quick Brown Fox Jumps Over The Lazy Dog

ps:如果不需要捕獲分佈的內容，則在不需要分組捕獲裡面加上?:，此表示匹配不捕獲。
var reg = /quicks(?:brown).+?(?;jumps)/ig; 這樣就不會有[1],[2],…[n]的分組捕獲了。

str.match(reg) 在字串中搜尋符合規則的內容，成功則返回陣列內容，失敗則返回null
```
  var str = `abc123def45g6hijkl789`;
  var reg1 = /d+/g;   // 每次匹配至少一個數字  且全域性匹配
  console.log( str.match(reg1));   // [123，45，6，789]
  var reg2 = /d+/;
  console.log(str.match(reg2)); // ["123", index: 3, input: "abc123def45g6hijkl789", groups: undefined]
  var reg3 = /d/;
  console.log(str.match(reg3));//["1", index: 3, input: "abc123def45g6hijkl789", groups: undefined]
  var reg4 = /d/g;
  console.log(str.match(reg4)) // ["1", "2", "3", "4", "5", "6", "7", "8", "9"]
```
由這四個例子可知，全域性匹配,得出的結果是一個陣列，如果不是全域性匹配，當找到數字123，它就會停止了。就只會彈出123，類似與exec()的結果。加上全域性匹配，就會從開始到結束一直去搜尋符合規則的。如果沒有加號，匹配的結果就是[“1”, “2”, “3”, “4”, “5”, “6”, “7”, “8”, “9”]，有了加號，每次匹配的數字就是至少一個了。

str.search(reg) 在字串中搜尋符合正則內容的索引,如果不存在，則返回-1。

  var str = `abcdefg`;
  var reg1 = /B/i;
  console.log(str.search(reg1)) // 1
  var reg2 = /B/;
  console.log(str.search(reg2)) // -1

str.replace(reg,new str/callback)
引數解釋: 第一個引數reg:要匹配的正則內容，
第二個引數new str/callback。callback，回撥函式裡也有三個引數：1 匹配的字元，2 匹配字元的索引，3 源字串。

  var str = `我愛北京天安門，天安門上太陽升`
  var reg = /北京|天安門/g
  console.log(str.replace(reg,`*`)) // 我愛**，*上太陽升

  var str = "我愛北京天安門，天安門上太陽升。";
  var re = /北京|天安門/g;  //  找到北京 或者天安門 全域性匹配
  var str2 = str.replace(re,function(str){
      console.log(str); //用來測試：函式的第一個引數代表每次搜尋到的符合正則的字元，所以第一次str指的是北京 第二次str是天安門 第三次str是天安門
      var result = ``;
      for(var i=0;i<str.length;i++){
          result += `*`;
      }              
      return result; //所以搜尋到了幾個字就返回幾個* 
  });
  console.log(str2)  //我愛*****，***上太陽升

額外例子：

1 找重複項最多的字元個數

  var str = `aibbicidhdieifigbdihdaii`;
  var arr = str.split(``); //把字串轉換為陣列
  str = arr.sort().join(``); //首先進行排序，這樣結果會把相同的字元放在一起，然後再轉換為字串
  console.log(str);  // aabbbcddddefghhiiiiiiiii
  var value = ``;
  var index = 0;
  var re = /(w)1+/g;  //匹配字元，且重複這個字元，重複次數至少一次。
  str.replace(re,function($0,$1){
      console.log($0);   //代表每次匹配成功的結果 : aa dd jj kk l sssssssssssssssss
      console.log($1);  //代表每次匹配成功的第一個子項，也就是w:  a d j k l S
      if(index<$0.length){  //如果index儲存的值小於$0的長度就進行下面的操作
          index = $0.length;  // 這樣index一直儲存的就在最大的長度
          value = $1;  //value儲存的是出現最多的這個字元
      }

  });
  console.log(`最多的字元:`+value+`,重複的次數:`+index);  // 最多的字元:i,重複的次數:9

大寫數字替換小寫數字
```
  var str = "2019";
  var a = ["零","壹","貳","叄","肆","伍","陸","柒","捌","玖"];
  str = str.replace(/d/g, function () {
      return a[arguments[0]];
  });
  console.log(str);//貳零壹玖
```
結尾

通過學習正則，發現正則不是很難，主要是因為沒有往正則方面去想，正則無非就是幾個字元加上方法就能匹配自己想要匹配的結果，在於嘗試，嘗試多了，自然而然就學會合理在專案中使用正則。
以上是我學習正則記錄的筆記，我把筆記整理到了github上了，歡迎閱讀，好的話給個star。大家如果覺得我有什麼做的不對的，請下方評論或私信，一起進步加油!

參考資料

徹底理解ReentrantLock
2018-05-03
ReentrantLock
徹底理解volatile
2018-05-02
徹底理解synchronized
2021-12-16
synchronized
徹底理解kubernetes CNI
2019-08-02
徹底理解Golang Map
2022-01-24
Golang
徹底理解JavaScript中的this
2018-12-03
JavaScript
徹底理解cookie，session，token
2019-05-16
CookieSession
徹底理解連結器：四
2018-09-17
小白(新手)如何徹底理解索引？
2020-11-19
索引
徹底理解 Dart mixin 機制
2019-06-01
Dart
徹底理解Hive中的鎖
2020-12-21
Hive
JavaScript之例題中徹底理解this
2019-03-04
JavaScript
js 徹底理解回撥函式
2018-05-22
JS函式
徹底理解閉包實現原理
2022-10-26
5分鐘徹底理解Object.keys
2019-03-02
Object
徹底理解瀏覽器的跨域
2019-04-10
瀏覽器跨域
一張圖徹底理解Javascript原型鏈
2018-06-22
JavaScript原型
徹底理解原碼、補碼、反碼
2020-11-13
徹底理解Node.js中的Buffer
2019-04-22
Node.js
一題帶你徹底理解sleep()和wait()
2018-11-16
AI
徹底理解spring的定製任務（scheduling）
2020-04-06
Spring
一文徹底理解微服務架構
2019-04-29
微服務架構
徹底理解Linux的DISPLAY變數的作用
2024-07-19
Linux變數
圖解｜這次，徹底理解MySQL的索引
2023-02-14
圖解MySql索引
這一次，徹底理解XSS攻擊
2020-12-31
ChatGPT，我徹徹底底淪陷了！
2023-04-09
ChatGPT
【面試】徹底理解 TCP 及面試常問
2019-03-29
面試TCP
徹底理解 JS Event Loop（瀏覽器環境）
2018-03-10
JSOOP瀏覽器
一文帶你徹底理解 JavaScript 原型物件
2019-08-05
JavaScript原型物件
徹底理解CSS結構偽類選擇器
2019-06-20
CSS
圖解｜從根上徹底理解MySQL的索引
2022-03-11
圖解MySql索引
徹底理解Spring如何解決迴圈依賴
2020-12-21
Spring
徹底理解SpringIOC、DI-這篇文章就夠了
2018-11-17
Spring
徹底理解安卓應用無響應機制
2019-04-15
安卓
一文讓你徹底理解 Java NIO 核心元件
2018-09-27
Java元件
一文讓你徹底理解 Java HashMap 和 ConcurrentHashMap
2018-07-25
JavaHashMap
從IL角度徹底理解回撥_委託_指標
2020-09-11
指標
徹底理解斜槓和反斜槓的區別
2020-10-09