深入分析正規表示式的子模式

技術之光發表於2022-03-21

首先,我們先看一段PHP程式碼:

<?php
  $time = date ("Y-m-d H:i:s");
  $pattern = "/\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}/i"; 
  if(preg_match($pattern,$time,$arr)){
  echo "<pre>";
  print_r($arr);    
  echo "</pre>";
  }
?>

顯示結果:

Array
(
  [0] => 2012-06-23 03:08:45
)

有沒有注意到,顯示的結果只有一條資料,即符合匹配模式的時間格式,那如果只有一條記錄的話,為什麼還要用陣列儲存呢?直接使用字串儲存不是更好?

帶著這個問題,我們來看下正規表示式中的子模式。

在正規表示式中,可以使用“(”和“)”將模式中的子字串括起來,以形成一個子模式。將子模式視為一個整體時,那麼它就相當於一個單個字元。

比如,我們將以上的程式碼稍微修改下,改成如下:

<?php
  $time = date ("Y-m-d H:i:s");
  $pattern = "/(\d{4})-(\d{2})-(\d{2}) (\d{2}):(\d{2}):(\d{2})/i"; 
  if(preg_match($pattern,$time,$arr)){
  echo "<pre>";
  print_r($arr);    
  echo "</pre>";
  }
?>

注意:我只修改了$pattern,在匹配模式中,使用了括號()

執行結果:

Array
(
  [0] => 2012-06-23 03:19:23
  [1] => 2012
  [2] => 06
  [3] => 23
  [4] => 03
  [5] => 19
  [6] => 23
)

總結:我們可以使用小括號給整個匹配模式進行分組,預設情況下,每個分組會自動擁有一個組號,規則是,從左到右,以分組的左括號為標誌,第一個出現的分組為組號1,第二個為組號2,以此類推。其中,分組0對應整個正規表示式。
對整個正則匹配模式進行了分組以後,就可以進一步使用“向後引用”來重複搜尋前面的某個分組匹配的文字。例如:\1代表分組1匹配的文字,\2代表分組2匹配的文字等等
我們可以進一步修改下程式碼,如下所示:

<?php
  $time = date ("Y-m-d H:i:s");
  $pattern = "/(\d{4})-(\d{2})-(\d{2}) (\d{2}):(\d{2}):(\d{2})/i";
  $replacement = "\$time格式為:$0<BR>替換後的格式為:\\1年\\2月\\3日 \\4時\\5分\\6秒";
  print preg_replace($pattern, $replacement, $time);
  if(preg_match($pattern,$time,$arr)){
    echo "<pre>";
    print_r($arr);    
    echo "</pre>";
  }
?>

注意:

因為是在雙引號中,所以使用分組的時候應該使用兩個反斜槓,如:\\1,而如果在單引號中,則使用一個反斜槓就可以了,如:\1
用於捕獲分組一種的內容:2012, 用於捕獲分組6中的內容          
執行結果:

$time格式為:2012-06-23 03:30:31
替換後的格式為:2012年06月23日 03時30分31秒
Array
(
  [0] => 2012-06-23 03:30:31
  [1] => 2012
  [2] => 06
  [3] => 23
  [4] => 03
  [5] => 30
  [6] => 31
)


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70015103/viewspace-2878875/,如需轉載,請註明出處,否則將追究法律責任。