[轉載] 使用String.split方法時要注意的問題

sdvingo發表於2007-05-21

在使用String.split方法分隔字串時,分隔符如果用到一些特殊字元,可能會得不到我們預期的結果。

我們看jdk doc中說明

public String[] split(String regex)

Splits this string around matches of the given regular expression.

引數regex是一個 regular-expression的匹配模式而不是一個簡單的String,他對一些特殊的字元可能會出現你預想不到的結果,比如測試下面的程式碼:

用豎線 | 分隔字串,你將得不到預期的結果

String[] aa = "aaa|bbb|ccc".split("|");
//String[] aa = "aaa|bbb|ccc".split("|"); 這樣才能得到正確的結果

for (int i = 0 ; i System.out.println("--"+aa[i]);
}

用豎 * 分隔字串執行將丟擲java.util.regex.PatternSyntaxException異常,用加號 + 也是如此。

String[] aa = "aaa*bbb*ccc".split("*");
//String[] aa = "aaa|bbb|ccc".split("*"); 這樣才能得到正確的結果

for (int i = 0 ; i System.out.println("--"+aa[i]);
}

顯然,+ * 不是有效的模式匹配規則表示式,用"*" "+"轉義後即可得到正確的結果。

"|" 分隔串時雖然能夠執行,但是卻不是預期的目的,"|"轉義後即可得到正確的結果。

還有如果想在串中使用""字元,則也需要轉義.首先要表達"aaaabbbb"這個串就應該用"aaaabbbb",如果要分隔就應該這樣才能得到正確結果:

String[] aa = "aaabbbbccc".split("");

[@more@]

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/443058/viewspace-915732/,如需轉載,請註明出處,否則將追究法律責任。

相關文章