正規表示式教程之匹配單個字元詳解
本文例項講述了正規表示式教程之匹配單個字元。分享給大家供大家參考,具體如下:
注:在所有例子中正規表示式匹配結果包含在源文字中的 【和 】之間,有的例子會使用Java來實現,如果是java本身正規表示式的用法,會在相應的地方說明。所有java例子都在JDK1.6.0_13下測試通過。
java測試程式碼:
/** * 根據正規表示式和要匹配的源文字,輸出匹配結果 * @param regex 正規表示式 * @param sourceText 要匹配的源文字 */ public static void matchAndPrint(String regex, String sourceText){ Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(sourceText); while(matcher.find()){ System.out.println(matcher.group()); } }
一、匹配純文字
1、只有一個匹配結果
首先來看一個簡單的正規表示式,today,雖然它本身是純文字,但它是一個正規表示式。來看一個例子:
源文字: Yesterday is history,tomorrow is a mystery, but today is a gift.
正規表示式: today
結果:Yesterday is history,tomorrow is a mystery, but 【today】 is a gift.
分析:這裡使用的正規表示式是純文字,它匹配了源文字中的today。
呼叫matchAndPrint方法,輸出結果是:
today
2、有多個匹配結果
源文字: Yesterday is history,tomorrow is a mystery, but today is a gift.
正規表示式: is
結果:Yesterday is history,tomorrow is a mystery, but 【today】 is a gift.
分析:在源文字中,有三個is,但輸出了四個is,因為history中的is也會被匹配到。
呼叫matchAndPrint方法,輸出結果是:
is
is
is
is
3、字母大小寫問題
正規表示式是區分字母大小寫的,但很多正規表示式的實現中也支援不區分大小寫的匹配操作。在JavaScript中,使用i標誌來執行一次不區分字母大小寫的匹配。 在java中,如果要不區分大小寫,那麼在編譯正規表示式時,可以指定:
Patternpattern = Pattern.compile(regex, Pattern.CASE_INSENSITIVE);
二、匹配任意字元
前面見到的正規表示式都是靜態的純文字,它們根本體現不出正規表示式的威力。下面,來看看如何使用正規表示式來匹配不可預知的字元。
在正規表示式中,特殊字元(或字符集合)用來給出要搜尋的東西。.字元(英文狀態句號)可以匹配任何一個單個字元。相當於DOS中的?字元和SQL中的_(下劃線)字元。如:正規表示式c.t將匹配cat、cut、cot等等。下面來看一個例子。
文字:
orders1.txt
orders2.txt
sales1.txt
salesA.txt
orders3.txt
sales2.txt
sales.txt
正規表示式: sales.
結果:
orders1.txt
orders2.txt
【sales1】.txt
【salesA】.txt
orders3.txt
【sales2】.txt
【sales.】txt
分析:正規表示式sales.將把由字串sales和另外一個字條構成的檔名找出來,從結果可以看出,.可以匹配字母、數字以及它本身。7個檔案中有4個與這個模式匹配。
如果呼叫matchAndPrint方法,輸出結果是:
sales1
salesA
sales2
sales.
三、匹配特殊字元
.字元在正規表示式中有著特殊的含義。如果模式裡需要一個.,就要想辦法來告訴正規表示式你需要的是.字元本身而不是它在正規表示式中的特殊含義。為此,必須在.前面加上\字元來對它進行轉義。\也是一個元字元(metacharacter,表示這個字元有特殊含義,而不是字元含義本身)。來看下面這個例子。
找出na或sa開頭的檔案,不管它後面跟的是一個什麼數字。
文字:
sales.txt
na1.txt
na2.txt
sa1.txt
sanatxt.txt
正規表示式:. a..txt
結果:
【sal】es.txt
【na1】.txt
【na2】.txt
【sa1】.txt
【sanatxt】.txt
分析:這個正則把na1.txt、na2.txt、sa1.txt找出來了,但是還找到了2個意料之外的結果。因為.a..txt這個正則中的.字元將與任意一個字元匹配。要想匹配.字元本身,那麼需要使用\轉義。把正則修改成.a.\.txt,則能夠滿足我們的需求。
注意:如果使用java,那麼.a.\.txt這個正規表示式應該寫成.a.\\.txt,因為\在java語言中也是一個轉義字元。
四、總結
正規表示式通常簡稱為模式,它們其實是一些字元構成的字串。這些字元可以是普通字元(純文字)或元字元(有特殊含義的特殊字元)。這裡介紹瞭如何使用普通字元和元字元去匹配單位字元。.可以匹配任何字元。\用來對字元進行轉義。在正規表示式中,有特殊含義的字元序列總是以\字元開頭。在接下來的文章中,我們將介紹如何匹配一組一組字元。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70015104/viewspace-2871097/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 正規表示式教程之匹配一組字元詳解字元
- 正規表示式教程之位置匹配詳解
- 匹配空白字元正規表示式字元
- 正規表示式匹配雙位元組字元字元
- 匹配純英文字元正規表示式字元
- 正規表示式匹配
- 正規表示式實現字元的模糊匹配功能示例字元
- 詳解正規表示式
- 正規表示式學習教程之回溯引用backreference詳解
- python 正規表示式匹配Python
- 正規表示式 多行匹配
- 匹配字母正規表示式
- leetcode - 正規表示式匹配LeetCode
- 正規表示式匹配原理
- 字串——正規表示式匹配字串
- 例項程式碼詳解正規表示式匹配換行
- 正規表示式 ^元字元字元
- 正規表示式 $ 元字元字元
- 正規表示式 字元和字元類字元
- 匹配正整數正規表示式
- 匹配字母、數字和中文字元正規表示式字元
- 正規表示式教程之操作符及說明詳解
- Python正規表示式詳解Python
- Linux正規表示式詳解Linux
- 詳解 Python 正規表示式Python
- 正規表示式匹配漢字
- 正規表示式匹配問題
- 匹配護照正規表示式
- 匹配小數正規表示式
- 匹配負數正規表示式
- 匹配整數正規表示式
- 匹配自然數正規表示式
- 匹配航班號正規表示式
- 正規表示式支配匹配模式模式
- JavaScript匹配中文正規表示式JavaScript
- 10. 正規表示式匹配
- 正規表示式的多行匹配
- 正規表示式元字元與普通字元字元