Java 正規表示式捕獲組分類
什麼是捕獲組?簡單點說,捕獲組就是把(Expression)中匹配到的內容儲存到一個按“(”出現的順序編號的組裡,以供後續引用,引用的方式有反向引用,或是RegExp.Snumber等方式,不同的語言,支援的引用方式不同。 |
Java 正規表示式的捕獲組分為:
普通捕獲組(Expression)
命名捕獲組(?Expression)
普通捕獲組
從正規表示式左側開始,每出現一個左括號"("記做一個分組,分組編號從 1 開始。0 代表整個表示式。
對於時間字串:2017-04-25,表示式如下
(\\d{4})-((\\d{2})-(\\d{2}))
有 4 個左括號,所以有 4 個分組:
編號 | 捕獲組 | 匹配 |
---|---|---|
0 | (\d{4})-((\d{2})-(\d{2})) | 2017-04-25 |
1 | (\d{4}) | 2017 |
2 | ((\d{2})-(\d{2})) | 04-25 |
3 | (\d{2}) | 04 |
4 | (\d{2}) | 25 |
public static final String DATE_STRING = "2017-04-25"; public static final String P_COMM = "(\\d{4})-((\\d{2})-(\\d{2}))"; Pattern pattern = Pattern.compile(P_COMM); Matcher matcher = pattern.matcher(DATE_STRING); matcher.find();//必須要有這句 System.out.printf("\nmatcher.group(0) value:%s", matcher.group(0)); System.out.printf("\nmatcher.group(1) value:%s", matcher.group(1)); System.out.printf("\nmatcher.group(2) value:%s", matcher.group(2)); System.out.printf("\nmatcher.group(3) value:%s", matcher.group(3)); System.out.printf("\nmatcher.group(4) value:%s", matcher.group(4));
命名捕獲組
每個以左括號開始的捕獲組,都緊跟著 ?,而後才是正規表示式。
對於時間字串:2017-04-25,表示式如下:
(?\\d{4})-(?(?\\d{2})-(?\\d{2}))
有 4 個命名的捕獲組,分別是:
編號 | 名稱 | 捕獲組 | 匹配 |
---|---|---|---|
0 | 0 | (?\d{4})-(?(?\d{2})-(?\d{2})) | 2017-04-25 |
1 | year | (?\d{4})- | 2017 |
2 | md | (?(?\d{2})-(?\d{2})) | 04-25 |
3 | month | (?\d{2}) | 04 |
4 | date | (?\d{2}) | 25 |
命名的捕獲組同樣也可以使用編號獲取相應值。
public static final String P_NAMED = "(?\\d{4})-(?(?\\d{2})-(?\\d{2}))"; public static final String DATE_STRING = "2017-04-25"; Pattern pattern = Pattern.compile(P_NAMED); Matcher matcher = pattern.matcher(DATE_STRING); matcher.find(); System.out.printf("\n===========使用名稱獲取============="); System.out.printf("\nmatcher.group(0) value:%s", matcher.group(0)); System.out.printf("\n matcher.group('year') value:%s", matcher.group("year")); System.out.printf("\nmatcher.group('md') value:%s", matcher.group("md")); System.out.printf("\nmatcher.group('month') value:%s", matcher.group("month")); System.out.printf("\nmatcher.group('date') value:%s", matcher.group("date")); matcher.reset(); System.out.printf("\n===========使用編號獲取============="); matcher.find(); System.out.printf("\nmatcher.group(0) value:%s", matcher.group(0)); System.out.printf("\nmatcher.group(1) value:%s", matcher.group(1)); System.out.printf("\nmatcher.group(2) value:%s", matcher.group(2)); System.out.printf("\nmatcher.group(3) value:%s", matcher.group(3)); System.out.printf("\nmatcher.group(4) value:%s", matcher.group(4));
PS:非捕獲組
在左括號後緊跟 ?:,而後再加上正規表示式,構成非捕獲組 (?:Expression)。
對於時間字串:2017-04-25,表示式如下:
(?:\\d{4})-((\\d{2})-(\\d{2}))
這個正規表示式雖然有四個左括號,理論上有 4 個捕獲組。但是第一組 (?:\d{4}),其實是被忽略的。當使用 matcher.group(4) 時,系統會報錯。
編號 | 捕獲組 | 匹配 |
---|---|---|
0 | (\d{4})-((\d{2})-(\d{2})) | 2017-04-25 |
1 | ((\d{2})-(\d{2})) | 04-25 |
2 | (\d{2}) | 04 |
3 | (\d{2}) | 25 |
總結
- 普通捕獲組使用方便;
- 命名捕獲組使用清晰;
- 非捕獲組目前在專案中還沒有用武之地。
原文地址:
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31559985/viewspace-2716776/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Java 正規表示式——捕獲組Java
- Python正規表示式實現非捕獲分組Python
- 正規表示式分組詳解
- 正規表示式中的捕獲和反向引用筆記筆記
- 正規表示式-非捕獲匹配,正向預查,反向預查
- 正規表示式分組例項詳解
- 正規表示式(java)Java
- java正規表示式Java
- 【java】正規表示式Java
- JAVA+MYSQL+CSV用正規表示式獲取CPU天梯分數JavaMySql
- 正規表示式 第三篇:分組匹配
- Java常用正規表示式Java
- java正規表示式大全(常用)Java
- java中的正規表示式Java
- Java017-正規表示式Java
- java正規表示式之 groupJava
- java 正規表示式 舉例Java
- Java正規表示式總結Java
- 正規表示式 字元和字元類字元
- python正規表示式(re模組)Python
- Python 正規表示式 re 模組Python
- 正規表示式(三):pythonre模組Python
- python re模組 正規表示式Python
- 正則表達選擇分組向後引用及捕獲和非捕獲分組(五)(1000則)
- 正則匹配的捕獲組
- Java 正規表示式例項操作Java
- 正規表示式(程式碼java版)Java
- Java-正規表示式regex庫Java
- 正規表示式中括號[]字元類字元
- 正規表示式 中括號[] 字元類字元
- Python 正規表示式模組詳解Python
- 正規表示式匹配雙位元組字元字元
- 正規表示式
- 正規表示式.
- 正規表示式之Matcher類中group方法
- Java 文字檢索神器 "正規表示式"Java
- Java 的正規表示式與爬蟲Java爬蟲
- Java 正規表示式替換斜槓Java