正規表示式匹配標點符號
摘抄:
str = str.replaceAll("[\\pP‘’“”]", "");
Unicode 編碼並不只是為某個字元簡單定義了一個編碼,而且還將其進行了歸類。
\pP 其中的小寫 p 是 property 的意思,表示 Unicode 屬性,用於 Unicode 正表示式的字首。
大寫 P 表示 Unicode 字符集七個字元屬性之一:標點字元。
其他六個是
L:字母;
M:標記符號(一般不會單獨出現);
Z:分隔符(比如空格、換行等);
S:符號(比如數學符號、貨幣符號等);
N:數字(比如阿拉伯數字、羅馬數字等);
C:其他字元
上面這七個是屬性,七個屬性下還有若干個子屬性,用於更進一步地進行細分。
Java 中用於 Unicode 的正規表示式資料都是由 Unicode 組織提供的。
Unicode 正規表示式標準(可以找到所有的子屬性)
http://www.unicode.org/reports/tr18/
各 Unicode 字元屬性的定義,可以用一看看某個字元具有什麼屬性。
http://www.unicode.org/Public/UNIDATA/UnicodeData.txt
這個文字文件一行是一個字元,第一列是 Unicode 編碼,第二列是字元名,第三列是 Unicode 屬性, 以及其他一些字元資訊。
Unicode 編碼並不只是為某個字元簡單定義了一個編碼,而且還將其進行了歸類。
\pP 其中的小寫 p 是 property 的意思,表示 Unicode 屬性,用於 Unicode 正表示式的字首。
大寫 P 表示 Unicode 字符集七個字元屬性之一:標點字元。
其他六個是
L:字母;
M:標記符號(一般不會單獨出現);
Z:分隔符(比如空格、換行等);
S:符號(比如數學符號、貨幣符號等);
N:數字(比如阿拉伯數字、羅馬數字等);
C:其他字元
上面這七個是屬性,七個屬性下還有若干個子屬性,用於更進一步地進行細分。
Java 中用於 Unicode 的正規表示式資料都是由 Unicode 組織提供的。
Unicode 正規表示式標準(可以找到所有的子屬性)
http://www.unicode.org/reports/tr18/
各 Unicode 字元屬性的定義,可以用一看看某個字元具有什麼屬性。
http://www.unicode.org/Public/UNIDATA/UnicodeData.txt
這個文字文件一行是一個字元,第一列是 Unicode 編碼,第二列是字元名,第三列是 Unicode 屬性, 以及其他一些字元資訊。
相關文章
- 正規表示式g全域性匹配識別符號符號
- 匹配html標籤正規表示式HTML
- 匹配 HTML 標籤正規表示式HTML
- 匹配HTML標籤的正規表示式HTML
- 正規表示式全域性匹配模式(g修飾符)模式
- 正規表示式匹配原理
- [譯]正規表示式匹配
- 字串——正規表示式匹配字串
- iOS正規表示式匹配iOS
- 誰能幫寫一個匹配任意HTML識別符號的正規表示式HTML符號
- 正規表示式支配匹配模式模式
- JavaScript匹配中文正規表示式JavaScript
- 模式匹配與正規表示式模式
- Swift 正規表示式匹配NSRegularExpressionSwiftExpress
- python 正規表示式匹配Python
- 匹配浮點數的正規表示式程式碼
- 匹配空白字元正規表示式字元
- 匹配 XML 檔案正規表示式XML
- leetcode - 正規表示式匹配LeetCode
- 匹配空行正規表示式程式碼
- 常用正規表示式匹配模式(java)模式Java
- JavaScript匹配註釋正規表示式JavaScript
- [JavaScript] 正規表示式單次匹配與多次匹配JavaScript
- 正規表示式模式修飾符模式
- 匹配iphone手機序列正規表示式iPhone
- 匹配HTML註釋的正規表示式HTML
- 匹配A股程式碼的正規表示式
- 正規表示式匹配雙位元組字元字元
- js正規表示式如何匹配註釋JS
- 匹配javascript註釋的正規表示式JavaScript
- Oracle正規表示式匹配中文的方法Oracle
- 匹配正負小數正規表示式程式碼
- 正規表示式.號元字元(除了回車符\r和換行符\n)字元
- 匹配視訊連結地址正規表示式
- 匹配純英文字元正規表示式字元
- 劍指offer——正規表示式匹配C++C++
- 正規表示式教程之位置匹配詳解
- 常用正規表示式匹配程式碼介紹