Java 正規表示式匹配模式(貪婪型、勉強型、佔有型)

受到鼓舞人發表於2022-03-16

Greediness(貪婪型):最大匹配

X?、X*、X+、X{n,} 是最大匹配。例如你要用 “<.+>” 去匹配 “a<tr>aava </tr>abb”,也許你所期待的結果是想匹配 “<tr>”,但是實際結果卻會匹配到 “<tr>aava </tr>。

在 Greediness 的模式下,會盡量大範圍的匹配,直到匹配了整個內容,這時發現匹配不能成功時,開始回退縮小匹配範圍,直到匹配成功

String test = "a<tr>aava </tr>abb ";
String reg = "<.+>";
System.out.println(test.replaceAll(reg, "###"));

輸出:a###abb

Reluctant(Laziness)(勉強型):最小匹配
X??、X*?、X+?、X{n,}? 是最小匹配,其實X{n,m}?和X{n }?有些多餘。在 Greediness 模式之後新增 ? 就成最小匹配。

在 Reluctant 的模式下,只要匹配成功,就不再繼續嘗試匹配更大範圍的內容

String test = "a<tr>aava </tr>abb ";
String reg = "<.+?>";
System.out.println(test.replaceAll(reg, "###"));

輸出:a###aava ###abb

與 Greediness 不同,Reluctant 模式下匹配了兩次內容

Possessive(佔有型):完全匹配
X?+、X*+、X++、X{n,}+ 是完全匹配,在 Greediness 模式之後新增 + 就成完全匹配。

Possessive 模式與 Greediness 有一定的相似性,那就是都儘量匹配最大範圍的內容,直到內容結束,但與 Greediness 不同的是,完全匹配不再回退嘗試匹配更小的範圍。

String test = "a<tr>aava </tr>abb ";
String reg = "<.++>";
String test2 = "<tr>";
String reg2 = "<tr>";
System.out.println(test.replaceAll(reg, "###"));
System.out.println(test2.replaceAll(reg2, "###"));

輸出:a<tr>aava </tr>abb

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70015105/viewspace-2871376/,如需轉載,請註明出處,否則將追究法律責任。

相關文章