JDK6筆記(4)—-正規表示式2
JDK6筆記(4)—-正規表示式2
一、組group
1、組是由圓括號分開的正規表示式,隨後可以根據它們的組號進行呼叫。
第0組匹配整個表示式,第1組匹配第1個圓括號擴起來的組,……依次類推。
如:A(B(C))D
有3個組:
第0組:ABCD
第1組:BC
第2組:C
例子:
package myfile;
import java.util.regex.*;
public class GroupR2 {
public static void main(String[] args) {
String[] input=new String[]{
“Java has regular expressions in 1.4”,
“regular expressions now expressing in Java”,
“Java represses oracular expressions”
};
Pattern
p1=Pattern.compile(“re//w*”),
p2=Pattern.compile(“Java.*”);
for(int i=0;i<input.length;i++){
System.out.println(“input “+i+”:”+input[i]);
Matcher
m1=p1.matcher(input[i]),
m2=p2.matcher(input[i]);
while(m1.find())
System.out.println(“m1.find() `”+m1.group()+”` start= “+m1.start()+” end= “+m1.end());
while(m2.find())
System.out.println(“m2.find() `”+m2.group()+”` start= “+m2.start()+” end= “+m2.end());
if(m1.lookingAt())
System.out.println(“m1.lookingAt() start = “+m1.start()+” end= “+m1.end());
if(m2.lookingAt())
System.out.println(“m2.lookingAt() start = “+m2.start()+” end= “+m2.end());
if(m1.matches())
System.out.println(“m1.matches() start= “+m1.start()+” end= “+m1.end());
if(m2.matches())
System.out.println(“m2.matches() start= “+m2.start()+” end= “+m2.end());
}
}
/**
* 輸u20986 結u26524 :
input 0:Java has regular expressions in 1.4
m1.find() `regular` start= 9 end= 16
m1.find() `ressions` start= 20 end= 28
m2.find() `Java has regular expressions in 1.4` start= 0 end= 35
m2.lookingAt() start = 0 end= 35
m2.matches() start= 0 end= 35
input 1:regular expressions now expressing in Java
m1.find() `regular` start= 0 end= 7
m1.find() `ressions` start= 11 end= 19
m1.find() `ressing` start= 27 end= 34
m2.find() `Java` start= 38 end= 42
m1.lookingAt() start = 0 end= 7
input 2:Java represses oracular expressions
m1.find() `represses` start= 5 end= 14
m1.find() `ressions` start= 27 end= 35
m2.find() `Java represses oracular expressions` start= 0 end= 35
m2.lookingAt() start = 0 end= 35
m2.matches() start= 0 end= 35
*/
}
2、Matcher物件的方法:
int groupCount() 分組的數目(不含0組)
String group() 返回前一次的匹配操作
String group(int i) 返回前一次匹配操作期間指定的組
int start(int group) 返回前一次匹配操作尋找到的組的起始下標
int end(int group) 返回前一次匹配操作尋找到的組的最後一個字元下標加一的值
二、模式標記
Pattern Pattern.compile(String regex, int flag)
flag有多個值:
(1)Pattern.CANON_EQ 兩個字元當且僅當它們的完全規範分解相匹配時,就認為匹配。預設時,不考慮。
(2)Pattern.CASE_INSENSITIVE 預設時,僅在ASCII字符集中進行。
(3)Pattern.COMMENTS 忽略空格符,且以#號開始到行末的註釋也忽略
(4)Pattern.DOTALL 表示式`.`匹配所有字元,包括行終結符。預設時,`.`不匹配行終結符。
(5)Pattern.MULTILINE 在多行模式下,表示式‘^`和`$`分別匹配一行的開始和結束。預設時,它們僅匹配輸入的完整字串的開始和結束。
見例子:
package myfile;
import java.util.regex.*;
public class ReFlags {
public static void main(String[] args) {
String str=”java has regex/nJava has regex/n” +
“JaVa has pretty good regular expressions/n”+
“Regular expressions are in JAva”;
Pattern p=Pattern.compile(“^java”, Pattern.CASE_INSENSITIVE | Pattern.MULTILINE);
Matcher m=p.matcher(str);
while(m.find()) //find()嘗u-29739 查u25214 與u-29723 模u24335 匹u-28339 的u-28781 入u24207 列u30340 下u19968 個u23376 序u21015 。
System.out.println(m.group()); //group()返u22238 由u20197 前u21305 配u25805 作u25152 匹u-28339 的u-28781 入u23376 序u21015 。
}
}
三、split()
它將輸入字串斷開成字串物件陣列,斷開邊界由正規表示式確定。
String split(CharSequence charseq);
String split(CharSequence charseq, int limit);
第2種limit限制了分裂的數目。
例子:
package myfile;
import java.util.regex.*;
import java.util.*;
public class SplitDemo {
static String input=”This!!unusual use!!of exclamation!!points”;
public static void main(String[] args) {
System.out.println(Arrays.asList(Pattern.compile(“!!”).split(input)));
//Arrays.asList() 返回一個受指定陣列支援的固定大小的列表。
System.out.println(Arrays.asList(Pattern.compile(“!!”).split(input,3)));
System.out.println(Arrays.asList(“Aha! String has a split() built in!”.split(” “)));
}
}
四、替換操作
1)replaceFirst(String replacement)
用replacement替換輸入字串中最先匹配的那部分。
2)replaceAll(String replacement)
用replacement替換輸入字串中所有的匹配部分。
3)appendReplacement(StringBuffer sbuf, String replacement)
逐步地在sbuf中執行替換
4)appendTail(StringBuffer sbuf,String replacement)
在一個或多個appendReplacement()呼叫之後被呼叫,以便複製輸入字串的剩餘部分。
例子:
package myfile;
import java.util.regex.*;
import java.io.*;
/*!Here`s a block of text to use as input to
* the regular expression matcher. Note that we`ll
* first extract the block of text by looking for
* the special delimiters, then process the
* extracted block.!
*/
public class TheReplacements {
public static void main(String[] args) throws Exception{
String s=”/*!Here`s a block of text to use as input to/n”+
” the regular expression matcher. Note that we`ll/n”+
“first extract the block of text by looking for/n”+
“the special delimiters, then process the/n”+
“extracted block.!*/”;
Pattern p=Pattern.compile(“///*!(.*)!//*/”, Pattern.DOTALL); //用以匹配在‘/*!’和‘!*/’之間的所有文字
Matcher mInput=p.matcher(s);
if(mInput.find())
s=mInput.group(1); //Captured by parentheses
//Replace two or more spaces with a single space:
s=s.replaceAll(” {2,}”,” “);
//Replace on or more spaces at the beginning of each line with no spaces.Must enable MULTILINE mode.
s=s.replaceAll(“(?m)^+”,””);
System.out.println(s);
s=s.replaceFirst(“[aeiou]”,”(VOWEL1)”);
StringBuffer sbuf=new StringBuffer();
Pattern p1=Pattern.compile(“[aeiou]”);
Matcher m1=p1.matcher(s);
//Process the find information as you perform the replacements:
while(m1.find())
m1.appendReplacement(sbuf, m1.group().toUpperCase());
//Put in the remainder of the text:
m1.appendTail(sbuf);
System.out.println(sbuf);
}
}
五、reset()方法,可將現有的Matcher物件應用於一個新的字元序列。
例子:
package myfile;
import java.util.regex.*;
import java.io.*;
public class Resetting {
public static void main(String[] args) {
Matcher m=Pattern.compile(“[frb][aiu][gx]”).matcher(“fix the rug with bags”);
while(m.find())
System.out.println(m.group());
m.reset(“fix the rug with bags”);
while(m.find())
System.out.println(m.group());
}
}
六、在JDK1.4之前,將字串分離成幾部份的方法是:
利用StringTokenizer將該字串“用標記斷開”。
例子:
package myfile;
import java.util.*;
public class ReplacingStringTokenizer {
public static void main(String[] args) {
// TODO 自動生成方法存根
String input =”But I`m not dead yet! I feel happy!”;
StringTokenizer stoke=new StringTokenizer(input);
while(stoke.hasMoreElements())
System.out.println(stoke.nextToken());
System.out.println(Arrays.asList(input.split(” “)));
}
}
相關文章
- JDK6筆記(3)—-正規表示式JDK筆記
- python筆記(2) 正規表示式Python筆記
- 正規表示式(筆記)筆記
- 正規表示式速查筆記筆記
- 正規表示式筆記(四)筆記
- 正規表示式筆記(三)筆記
- 正規表示式筆記(二)筆記
- 正規表示式筆記(一)筆記
- 正規表示式學習筆記筆記
- JS筆記(15): 正規表示式JS筆記
- 7,正規表示式(perl筆記)筆記
- JavaScript正規表示式迷你書-筆記JavaScript筆記
- Ruby學習筆記-正規表示式筆記
- 正規表示式學習筆記一筆記
- PERL學習筆記---正規表示式筆記
- 正規表示式學習筆記 (轉)筆記
- python爬蟲學習筆記4-正規表示式Python爬蟲筆記
- JavaScript正規表示式學習筆記(一)JavaScript筆記
- Python學習筆記 - 正規表示式Python筆記
- 最容易理解的正規表示式筆記筆記
- apache url rewrite及正規表示式筆記Apache筆記
- Python筆記五之正規表示式Python筆記
- JavaScript正規表示式(2)JavaScript
- oracle 正規表示式2Oracle
- 正規表示式學習筆記(1)-認識正則筆記
- js加固之正規表示式學習筆記JS筆記
- 學習筆記-5.1.正規表示式1筆記
- Python下正規表示式學習筆記Python筆記
- JS助記 ----- 正規表示式JS
- python 中的正規表示式學習筆記Python筆記
- Python 正規表示式 re 模組簡明筆記Python筆記
- Kotlin學習筆記(五十八)正規表示式Kotlin筆記
- PERL學習筆記---正規表示式的應用筆記
- Ruby筆記《一》Regexp正規表示式薦筆記
- 8,以正規表示式進行匹配(perl筆記)筆記
- 工作學習筆記(二) 正規表示式(轉載)筆記
- 《前端竹節》(2)【正規表示式】前端
- Golang正則筆記 :使用正規表示式處理題庫文字Golang筆記