本文例項講述了正規表示式教程之匹配單個字元。分享給大家供大家參考，具體如下：

注：在所有例子中正規表示式匹配結果包含在源文字中的【和】之間，有的例子會使用Java來實現，如果是java本身正規表示式的用法，會在相應的地方說明。所有java例子都在JDK1.6.0_13下測試通過。

java測試程式碼：

/**
 * 根據正規表示式和要匹配的源文字，輸出匹配結果
 * @param regex 正規表示式
 * @param sourceText 要匹配的源文字
 */
public static void matchAndPrint(String regex, String sourceText){
  Pattern pattern = Pattern.compile(regex);
  Matcher matcher = pattern.matcher(sourceText);
  while(matcher.find()){
    System.out.println(matcher.group());
  }
}

一、匹配純文字

1、只有一個匹配結果

首先來看一個簡單的正規表示式，today，雖然它本身是純文字，但它是一個正規表示式。來看一個例子：

源文字： Yesterday is history,tomorrow is a mystery, but today is a gift.

正規表示式： today

結果：Yesterday is history,tomorrow is a mystery, but 【today】 is a gift.

分析：這裡使用的正規表示式是純文字，它匹配了源文字中的today。

呼叫matchAndPrint方法，輸出結果是：

today

2、有多個匹配結果

源文字： Yesterday is history,tomorrow is a mystery, but today is a gift.

正規表示式： is

結果：Yesterday is history,tomorrow is a mystery, but 【today】 is a gift.

分析：在源文字中，有三個is,但輸出了四個is,因為history中的is也會被匹配到。

呼叫matchAndPrint方法，輸出結果是：

is

3、字母大小寫問題

正規表示式是區分字母大小寫的，但很多正規表示式的實現中也支援不區分大小寫的匹配操作。在JavaScript中，使用i標誌來執行一次不區分字母大小寫的匹配。在java中，如果要不區分大小寫，那麼在編譯正規表示式時，可以指定：

Patternpattern = Pattern.compile(regex, Pattern.CASE_INSENSITIVE);

二、匹配任意字元

前面見到的正規表示式都是靜態的純文字，它們根本體現不出正規表示式的威力。下面，來看看如何使用正規表示式來匹配不可預知的字元。

在正規表示式中，特殊字元（或字符集合）用來給出要搜尋的東西。.字元（英文狀態句號）可以匹配任何一個單個字元。相當於DOS中的?字元和SQL中的_（下劃線）字元。如：正規表示式c.t將匹配cat、cut、cot等等。下面來看一個例子。

文字：

orders1.txt

orders2.txt

sales1.txt

salesA.txt

orders3.txt

sales2.txt

sales.txt

正規表示式： sales.

結果：

orders1.txt

orders2.txt

【sales1】.txt

【salesA】.txt

orders3.txt

【sales2】.txt

【sales.】txt

分析：正規表示式sales.將把由字串sales和另外一個字條構成的檔名找出來，從結果可以看出，.可以匹配字母、數字以及它本身。7個檔案中有4個與這個模式匹配。

如果呼叫matchAndPrint方法，輸出結果是：

sales1

salesA

sales2

sales.

三、匹配特殊字元

.字元在正規表示式中有著特殊的含義。如果模式裡需要一個.，就要想辦法來告訴正規表示式你需要的是.字元本身而不是它在正規表示式中的特殊含義。為此，必須在.前面加上\字元來對它進行轉義。\也是一個元字元(metacharacter，表示這個字元有特殊含義，而不是字元含義本身)。來看下面這個例子。

找出na或sa開頭的檔案，不管它後面跟的是一個什麼數字。

文字：

sales.txt

na1.txt

na2.txt

sa1.txt

sanatxt.txt

正規表示式：. a..txt

結果：

【sal】es.txt

【na1】.txt

【na2】.txt

【sa1】.txt

【sanatxt】.txt

分析：這個正則把na1.txt、na2.txt、sa1.txt找出來了，但是還找到了2個意料之外的結果。因為.a..txt這個正則中的.字元將與任意一個字元匹配。要想匹配.字元本身，那麼需要使用\轉義。把正則修改成.a.\.txt,則能夠滿足我們的需求。

注意：如果使用java，那麼.a.\.txt這個正規表示式應該寫成.a.\\.txt，因為\在java語言中也是一個轉義字元。

四、總結

正規表示式通常簡稱為模式，它們其實是一些字元構成的字串。這些字元可以是普通字元（純文字）或元字元（有特殊含義的特殊字元）。這裡介紹瞭如何使用普通字元和元字元去匹配單位字元。.可以匹配任何字元。\用來對字元進行轉義。在正規表示式中，有特殊含義的字元序列總是以\字元開頭。在接下來的文章中，我們將介紹如何匹配一組一組字元。

正規表示式教程之匹配單個字元詳解

相關文章