sql裡的正規表示式

czl---發表於2020-11-16

SQL語句還可以搭配正規表示式作為查詢條件,很是有用。

REGEXP_LIKE(匹配)
REGEXP_INSTR (包含)
REGEXP_REPLACE(替換)
REGEXP_SUBSTR(提取)

 

表 1:定位元字元

元字元說明
^使表示式定位至一行的開頭
$使表示式定位至一行的末尾

 

表 2:量詞或重複操作符

量詞說明
*匹配 0 次或更多次
?匹配 0 次或 1 次
+匹配 1 次或更多次
{m}正好匹配 m 次
{m,}至少匹配 m 次
{m, n}至少匹配 m 次但不超過 n 次

 

 

表 3:預定義的 POSIX 字元類

字元類說明
[:alpha:]字母字元
[:lower:]小寫字母字元
[:upper:]大寫字母字元
[:digit:]數字
[:alnum:]字母數字字元
[:space:]空白字元(禁止列印),如回車符、換行符、豎直製表符和換頁符
[:punct:]標點字元
[:cntrl:]控制字元(禁止列印)
[:print:]可列印字元

 

 

表 4:表示式的替換匹配和分組

元字元說明
|替換分隔替換選項,通常與分組操作符 () 一起使用
( )分組將子表示式分組為一個替換單元、量詞單元或後向引用單元(參見“後向引用”部分)
[char]字元列表表示一個字元列表;一個字元列表中的大多數元字元(除字元類、^ 和 - 元字元之外)被理解為文字

 

 

表 5:REGEXP_LIKE 操作符

語法說明
REGEXP_LIKE(source_string, pattern
[, match_parameter])
source_string 支援字元資料型別(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2 和 NCLOB,但不包括 LONG)。pattern 引數是正規表示式的另一個名稱。match_parameter 允許可選的引數(如處理換行符、保留多行格式化以及提供對區分大小寫的控制)。

 

 

表 6:REGEXP_INSTR 函式

語法說明
REGEXP_INSTR(source_string, pattern
[, start_position
[, occurrence
[, return_option
[, match_parameter]]]])
該函式查詢 pattern ,並返回該模式的第一個位置。您可以隨意指定您想要開始搜尋的 start_position。 occurrence 引數預設為 1,除非您指定您要查詢接下來出現的一個模式。return_option 的預設值為 0,它返回該模式的起始位置;值為 1 則返回符合匹配條件的下一個字元的起始位置。

 

 

表 7: 5 位數字加 4 位郵政編碼表示式的說明

語法說明
 必須匹配的空白
[:digit:]POSIX 數字類
]字元列表的結尾
{5}字元列表正好重複出現 5 次
(子表示式的開頭
-一個文字連字元,因為它不是一個字元列表內的範圍元字元
[字元列表的開頭
[:digit:]POSIX [:digit:]類
[字元列表的開頭
]字元列表的結尾
{4}字元列表正好重複出現 4 次
)結束圓括號,結束子表示式
?? 量詞匹配分組的子表示式 0 或 1 次,從而使得 4 位程式碼可選
$定位元字元,指示行尾

 

 

表 8:REGEXP_SUBSTR 函式

語法說明
REGEXP_SUBSTR(source_string, pattern
[, position [, occurrence
[, match_parameter]]])
REGEXP_SUBSTR 函式返回匹配模式的子字串。

 

 

表 9: REGEXP_REPLACE 函式

語法說明
REGEXP_REPLACE(source_string, pattern
[, replace_string [, position
[,occurrence, [match_parameter]]]])
該函式用一個指定的 replace_string 來替換匹配的模式,從而允許複雜的“搜尋並替換”操作。

 

 

表 10:後向引用元字元

元字元說明
\digit反斜線緊跟著一個 1 到 9 之間的數字,反斜線匹配之前的用括號括起來的第 digit 個子表示式。
(注意:反斜線在正規表示式中有另一種意義,取決於上下文,它還可能表示 Escape 字元。

 

 

表 11:模式交換正規表示式的說明

正規表示式專案說明
(第一個子表示式的開頭
.匹配除換行符之外的任意單字元
*重複操作符,匹配之前的 . 元字元 0 到 n 次
)第一個子表示式的結尾;匹配結果在 \1
中獲取(在這個例子中,結果為 Ellen。)
 必須存在的空白
(第二個子表示式的開頭
.匹配除換行符之外的任意單個字元
*重複操作符,匹配之前的 . 元字元 0 到 n 次
)第二個子表示式的結尾;匹配結果在 \2
中獲取(在這個例子中,結果為 Hildi。)
 空白
(第三個子表示式的開頭
.匹配除換行符之外的任意單字元
*重複操作符,匹配之前的 . 元字元 0 到 n 次
)第三個子表示式的結尾;匹配結果在 \3
中獲取(在這個例子中,結果為 Smith。)

 

 

表 12:社會保險號碼正規表示式的說明

正規表示式專案說明
^行首字元(正規表示式在匹配之前不能有任何前導字元。)
(開始子表示式並列出用 | 元字元分開的可替換選項
[字元列表的開頭
[:digit:]POSIX 數字類
]字元列表的結尾
{3}字元列表正好重複出現 3 次
-連字元
[字元列表的開頭
[:digit:]POSIX 數字類
]字元列表的結尾
{2}字元列表正好重複出現 2 次
-另一個連字元
[字元列表的開頭
[:digit:]POSIX 數字類
]字元列表的結尾
{4}字元列表正好重複出現 4 次
|替換元字元;結束第一個選項並開始下一個替換表示式
[字元列表的開頭
[:digit:]POSIX 數字類
]字元列表的結尾
{9}字元列表正好重複出現 9 次
)結束圓括號,結束用於替換的子表示式組
$定位元字元,指示行尾;沒有額外的字元能夠符合模式


  

 

 

SELECT * FORM. tKHXX where REGEXP_LIKE(SJHM, '^[1]{1}[35]{1}[[:digit:]]{9}$'
針對這個表示式解釋一下
^ 表示開始
$ 表示結束
[]內部為匹配範圍
{}裡的內容表時個數,有幾位 


 手機號碼的特點是以 1開頭接著是3或5再加9位的數字 所以這麼理解
1開頭 表示式為 ^[1]{1} 意為 開始1位裡包含1
3或5 表示式為 [35]{1}
9位數字結束 為: [[:digit:]]{9}$ 這裡[:digit:]為特殊寫法,代表為數字 再加個結束符$