正規表示式模式修飾符

懷特然後發表於2022-03-16

i (PCRE_CASELESS)

如果設定了這個修飾符,模式中的字母會進行大小寫不敏感匹配。

m (PCRE_MULTILINE)

預設情況下,PCRE 認為目標字串是由單行字元組成的(然而實際上它可能會包含多行), “行首”元字元 (^) 僅匹配字串的開始位置, 而”行末”元字元 ($) 僅匹配字串末尾, 或者最後的換行符(除非設定了 D 修飾符)。這個行為和 perl 相同。 當這個修飾符設定之後,“行首”和“行末”就會匹配目標字串中任意換行符之前或之後,另外, 還分別匹配目標字串的最開始和最末尾位置。這等同於 perl 的 /m 修飾符。如果目標字串 中沒有 “\n” 字元,或者模式中沒有出現 ^ 或 $,設定這個修飾符不產生任何影響。

s (PCRE_DOTALL)

如果設定了這個修飾符,模式中的點號元字元匹配所有字元,包含換行符。如果沒有這個 修飾符,點號不匹配換行符。這個修飾符等同於 perl 中的/s修飾符。 一個取反字元類比如 [^a] 總是匹配換行符,而不依賴於這個修飾符的設定。

x (PCRE_EXTENDED)

如果設定了這個修飾符,模式中的沒有經過轉義的或不在字元類中的空白資料字元總會被忽略, 並且位於一個未轉義的字元類外部的#字元和下一個換行符之間的字元也被忽略。 這個修飾符 等同於 perl 中的 /x 修飾符,使被編譯模式中可以包含註釋。 注意:這僅用於資料字元。 空白字元 還是不能在模式的特殊字元序列中出現,比如序列 (?( 引入了一個條件子組(譯註: 這種語法定義的 特殊字元序列中如果出現空白字元會導致編譯錯誤。 比如(?(就會導致錯誤)。

e (PREG_REPLACE_EVAL)

Warning

本特性已自 PHP 5.5.0 起廢棄。強烈建議不要使用本特性。

如果設定了這個被棄用的修飾符, preg_replace() 在進行了對替換字串的 後向引用替換之後, 將替換後的字串作為php 程式碼評估執行(eval 函式方式),並使用執行結果 作為實際參與替換的字串。單引號、雙引號、反斜線(\)和 NULL 字元在 後向引用替換時會被用反斜線轉義.

Caution

The addslashes() function is run on each matched backreference before the substitution takes place. As such, when the backreference is used as a quoted string, escaped characters will be converted to literals. However, characters which are escaped, which would normally not be converted, will retain their slashes. This makes use of this modifier very complicated.

Caution

請確保 replacement 引數由合法 php 程式碼字串組成,否則 php 將會 在preg_replace() 呼叫的行上產生一個解釋錯誤。

Caution

Use of this modifier is discouraged, as it can easily introduce security vulnerabilites:

<?php
$html = $_POST['html'];// uppercase headings
$html = preg_replace(
'(<h([1-6])>(.*?)</h\1>)e',
'"<h$1>" . strtoupper("$2") . "</h$1>"',
$html
);

The above example code can be easily exploited by passing in a string such as <h1>{${eval($_GET[php_code])}}</h1>. This gives the attacker the ability to execute arbitrary PHP code and as such gives him nearly complete access to your server.

To prevent this kind of remote code execution vulnerability the preg_replace_callback() function should be used instead:

<?php
$html = $_POST['html'];// uppercase headings
$html = preg_replace_callback(
'(<h([1-6])>(.*?)</h\1>)',
function ($m) {
return "<h$m[1]>" . strtoupper($m[2]) . "</h$m[1]>"
},
$html
);

Note:

僅 preg_replace() 使用此修飾符,其他 PCRE 函式忽略此修飾符。

A (PCRE_ANCHORED)
如果設定了這個修飾符,模式被強制為”錨定”模式,也就是說約束匹配使其僅從 目標字串的開始位置搜尋。這個效果同樣可以使用適當的模式構造出來,並且 這也是 perl 種實現這種模式的唯一途徑。
D (PCRE_DOLLAR_ENDONLY)
如果這個修飾符被設定,模式中的元字元美元符號僅僅匹配目標字串的末尾。如果這個修飾符 沒有設定,當字串以一個換行符結尾時, 美元符號還會匹配該換行符(但不會匹配之前的任何換行符)。 如果設定了修飾符m,這個修飾符被忽略. 在 perl 中沒有與此修飾符等同的修飾符。
S
當一個模式需要多次使用的時候,為了得到匹配速度的提升,值得花費一些時間 對其進行一些額外的分析。如果設定了這個修飾符,這個額外的分析就會執行。當前, 這種對一個模式的分析僅僅適用於非錨定模式的匹配(即沒有單獨的固定開始字元)。
U (PCRE_UNGREEDY)
這個修飾符逆轉了量詞的”貪婪”模式。 使量詞預設為非貪婪的,通過量詞後緊跟? 的方式可以使其成為貪婪的。這和 perl 是不相容的。 它同樣可以使用 模式內修飾符設定 (?U)進行設定, 或者在量詞後以問號標記其非貪婪(比如.*?)。
Note:

在非貪婪模式,通常不能匹配超過 pcre.backtrack_limit 的字元。

X (PCRE_EXTRA)
這個修飾符開啟了 PCRE 與 perl 不相容的附件功能。模式中的任意反斜線後就 ingen 一個 沒有特殊含義的字元都會導致一個錯誤,以此保留這些字元以保證向後相容性。 預設情況下,在 perl 中,反斜線緊跟一個沒有特殊含義的字元被認為是該字元的原文。 當前沒有其他特性由這個修飾符控制。
J (PCRE_INFO_JCHANGED)
內部選項設定(?J)修改本地的PCRE_DUPNAMES選項。允許子組重名, (譯註:只能通過內部選項設定,外部的 /J 設定會產生錯誤。)
u (PCRE_UTF8)
此修正符開啟一個與 perl 不相容的附加功能。 模式字串被認為是utf-8的. 這個修飾符 從 unix 版php 4.1.0 或更高,win32版 php 4.2.3 開始可用。 php 4.3.5 開始檢查模式的 utf-8 合法性。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70015107/viewspace-2871388/,如需轉載,請註明出處,否則將追究法律責任。

相關文章