JS正規表示式精簡教程(JavaScript RegExp 物件)

weixin_33807284發表於2019-02-24

什麼是 RegExp?

RegExp 是正規表示式的縮寫。

當您檢索某個文字時,可以使用一種模式來描述要檢索的內容。RegExp 就是這種模式。

簡單的模式可以是一個單獨的字元。

更復雜的模式包括了更多的字元,並可用於解析、格式檢查、替換等等。

您可以規定字串中的檢索位置,以及要檢索的字元型別,等等。

定義 RegExp

const pattern = new RegExp('str');

RegExp 物件的方法

  • test()
  • exec()
  • compile()

test() 方法檢索字串中的指定值。返回值是 true 或 false。

const pattern = new RegExp('str');
console.log(pattern.test('input string')); // true

exec() 方法檢索字串中的指定值。返回值是被找到的值。如果沒有發現匹配,則返回 null。

const pattern = new RegExp('str');
console.log(pattern.test('input string')); // [ 'str', index: 6, input: 'input string', groups: undefined ]

compile() 方法用於改變 RegExp(既可以改變檢索模式,也可以新增或刪除第二個引數)。

const pattern = new RegExp('e');
console.log(pattern.test('The best things in life are free'));
pattern.compile('d');
console.log(pattern.test('The best things in life are free'));

支援正規表示式的 String 物件的方法

  • search()
  • match()
  • replace()
  • split()

search()方法檢索與正規表示式相匹配的子字串。search() 方法不執行全域性匹配,它將忽略標誌 g。它同時忽略 regexp 的 lastIndex 屬性,並且總是從字串的開始進行檢索,這意味著它總是返回 stringObject 的第一個匹配的位置。

// stringObject.search(regexp) 語法 (匹配不上時返回 -1)

const stringObj = 'Hello world';
const result = stringObj.search(/l{3}/);
console.log(result); // -1

match() 方法可在字串內檢索指定的值,或找到一個或多個正規表示式的匹配。該方法類似 indexOf() 和 lastIndexOf(),但是它返回指定的值,而不是字串的位置。

// stringObject.match(regexp) 語法 (匹配不上時返回 null)

const stringObj = 'Hello world';
const result = stringObj.match(/l{2}/);
console.log(result); // [ 'll', index: 2, input: 'Hello world', groups: undefined ]

replace() 方法用於在字串中用一些字元替換另一些字元,或替換一個與正規表示式匹配的子串。
字串 stringObject 的 replace() 方法執行的是查詢並替換的操作。它將在 stringObject 中查詢與 regexp 相匹配的子字串,然後用 replacement 來替換這些子串。如果 regexp 具有全域性標誌 g,那麼 replace() 方法將替換所有匹配的子串。否則,它只替換第一個匹配子串。

// stringObject.replace(regexp/substr,replacement) 語法 (匹配不上時返回原字串)

const stringObj = 'Hello world';
const result = stringObj.replace(/l{2}/,'ii');
console.log(result); // Heiio world

split() 方法用於把一個字串分割成字串陣列。
返回一個字串陣列。該陣列是通過在 separator 指定的邊界處將字串 stringObject 分割成子串建立的。返回的陣列中的字串不包括 separator 自身。
但是,如果 separator 是包含子表示式的正規表示式,那麼返回的陣列中包括與這些子表示式匹配的字串(但不包括與整個正規表示式匹配的文字)。

// stringObject.split(separator,howmany) 語法 (匹配不上時返回 [stringObject])

const stringObj = 'Hello world';
const result = stringObj.split(/l{2}/);
console.log(result) // [ 'He', 'o world' ]

RegExp 引數

  • 直接量語法
/pattern/attributes
  • 建立 RegExp 物件的語法
new RegExp(pattern, attributes);

引數 pattern 是一個字串,指定了正規表示式的模式或其他正規表示式。

引數 attributes 是一個可選的字串,包含屬性 "g"、"i" 和 "m",分別用於指定全域性匹配、區分大小寫的匹配和多行匹配。ECMAScript 標準化之前,不支援 m 屬性。如果 pattern 是正規表示式,而不是字串,則必須省略該引數。

注意

const reg = /str/;
const newReg = reg.compile(reg, 'i'); // 報錯
console.log(newReg.test('string'))

// 正確示例
const reg = /str/;
const newReg = new RegExp(reg, 'i');
console.log(newReg.test('string'));

附表

  • 修飾符
修飾符 描述
i 執行對大小寫不敏感的匹配。
g 執行全域性匹配
m 執行多行匹配
  • 方括號
表示式 描述
[abc] 查詢方括號之間的任何字元
1 查詢任何不在方括號之間的任何字元
[0-9] 查詢任何從0至9的數字
[a-z] 查詢任何從小寫a至小寫z的字元
[A-Z] 查詢任何從大寫A至大寫Z的字元
[A-z] 查詢任何從大寫A至小寫z的字元
[adgk] 查詢給定集合內的任何字元
2 查詢給定集合外的任何字元
(red\ blue\ green) 查詢任何指定的選項
  • 元字元
元字元 描述
. 查詢單個字元,除了換行和行結束符。
w 查詢單詞字元。
W 查詢非單詞字元。
d 查詢數字字元。
D 查詢非數字字元。
s 查詢空白字元。
S 查詢非空白字元。
b 匹配單詞邊界。
B 匹配非單詞邊界。
0 查詢 NUL 字元。
n 查詢換行符。
f 查詢換頁符。
r 查詢回車符。
t 查詢製表符。
v 查詢垂直製表符。
xxx 查詢以八進位制數 xxx 規定的字元。
xdd 查詢以十六進位制數 dd 規定的字元。
uxxxx 查詢以十六進位制數 xxxx 規定的 Unicode 字元。
  • 量詞
元字元 描述
n+ 匹配任何包含至少一個 n 的字串。
n* 匹配任何包含零個或多個 n 的字串。
n? 匹配任何包含零個或一個 n 的字串。
n{X} 匹配包含 X 個 n 的序列的字串。
n{X,Y} 匹配包含 X 至 Y 個 n 的序列的字串。
n{X,} 匹配包含至少 X 個 n 的序列的字串。
n$ 匹配任何結尾為 n 的字串。
^n 匹配任何開頭為 n 的字串。
?=n 匹配任何其後緊接指定字串 n 的字串。
?!n 匹配任何其後沒有緊接指定字串 n 的字串。

  1. abc
  2. adgk

相關文章