Java 正規表示式捕獲組分類

安全劍客發表於2020-09-03
導讀 什麼是捕獲組?簡單點說,捕獲組就是把(Expression)中匹配到的內容儲存到一個按“(”出現的順序編號的組裡,以供後續引用,引用的方式有反向引用,或是RegExp.Snumber等方式,不同的語言,支援的引用方式不同。

Java 正規表示式捕獲組分類Java 正規表示式捕獲組分類
Java 正規表示式的捕獲組分為:
普通捕獲組(Expression)
命名捕獲組(?Expression)

普通捕獲組

從正規表示式左側開始,每出現一個左括號"("記做一個分組,分組編號從 1 開始。0 代表整個表示式。

對於時間字串:2017-04-25,表示式如下

(\\d{4})-((\\d{2})-(\\d{2}))

有 4 個左括號,所以有 4 個分組:

編號 捕獲組 匹配
0 (\d{4})-((\d{2})-(\d{2})) 2017-04-25
1 (\d{4}) 2017
2 ((\d{2})-(\d{2})) 04-25
3 (\d{2}) 04
4 (\d{2}) 25
public static final String DATE_STRING = "2017-04-25";
public static final String P_COMM = "(\\d{4})-((\\d{2})-(\\d{2}))";
 
Pattern pattern = Pattern.compile(P_COMM);
Matcher matcher = pattern.matcher(DATE_STRING);
matcher.find();//必須要有這句
System.out.printf("\nmatcher.group(0) value:%s", matcher.group(0));
System.out.printf("\nmatcher.group(1) value:%s", matcher.group(1));
System.out.printf("\nmatcher.group(2) value:%s", matcher.group(2));
System.out.printf("\nmatcher.group(3) value:%s", matcher.group(3));
System.out.printf("\nmatcher.group(4) value:%s", matcher.group(4));
命名捕獲組

每個以左括號開始的捕獲組,都緊跟著 ?,而後才是正規表示式。

對於時間字串:2017-04-25,表示式如下:

(?\\d{4})-(?(?\\d{2})-(?\\d{2}))

有 4 個命名的捕獲組,分別是:

編號 名稱 捕獲組 匹配
0 0 (?\d{4})-(?(?\d{2})-(?\d{2})) 2017-04-25
1 year (?\d{4})- 2017
2 md (?(?\d{2})-(?\d{2})) 04-25
3 month (?\d{2}) 04
4 date (?\d{2}) 25

命名的捕獲組同樣也可以使用編號獲取相應值。

public static final String P_NAMED = "(?\\d{4})-(?(?\\d{2})-(?\\d{2}))";
public static final String DATE_STRING = "2017-04-25";
 
Pattern pattern = Pattern.compile(P_NAMED);
Matcher matcher = pattern.matcher(DATE_STRING);
matcher.find();
System.out.printf("\n===========使用名稱獲取=============");
System.out.printf("\nmatcher.group(0) value:%s", matcher.group(0));
System.out.printf("\n matcher.group('year') value:%s", matcher.group("year"));
System.out.printf("\nmatcher.group('md') value:%s", matcher.group("md"));
System.out.printf("\nmatcher.group('month') value:%s", matcher.group("month"));
System.out.printf("\nmatcher.group('date') value:%s", matcher.group("date"));
matcher.reset();
System.out.printf("\n===========使用編號獲取=============");
matcher.find();
System.out.printf("\nmatcher.group(0) value:%s", matcher.group(0));
System.out.printf("\nmatcher.group(1) value:%s", matcher.group(1));
System.out.printf("\nmatcher.group(2) value:%s", matcher.group(2));
System.out.printf("\nmatcher.group(3) value:%s", matcher.group(3));
System.out.printf("\nmatcher.group(4) value:%s", matcher.group(4));
PS:非捕獲組

在左括號後緊跟 ?:,而後再加上正規表示式,構成非捕獲組 (?:Expression)。

對於時間字串:2017-04-25,表示式如下:

(?:\\d{4})-((\\d{2})-(\\d{2}))

這個正規表示式雖然有四個左括號,理論上有 4 個捕獲組。但是第一組 (?:\d{4}),其實是被忽略的。當使用 matcher.group(4) 時,系統會報錯。

編號 捕獲組 匹配
0 (\d{4})-((\d{2})-(\d{2})) 2017-04-25
1 ((\d{2})-(\d{2})) 04-25
2 (\d{2}) 04
3 (\d{2}) 25
總結
  1. 普通捕獲組使用方便;
  2. 命名捕獲組使用清晰;
  3. 非捕獲組目前在專案中還沒有用武之地。

原文來自:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69955379/viewspace-2716903/,如需轉載,請註明出處,否則將追究法律責任。

相關文章