oracle10g支援正規表示式

rainbowbridg發表於2007-01-10

Oracle 8 和Oracle 9i中缺乏靈活性的SQL 正規表示式最終在Oracle 10g中得到了解決。Oracle 資料庫目前內建了符合POSIX 標準的正規表示式。

  四個新的函式分別是:REGEXP_LIKE、REGEXP_INSTR、REGEXP_SUBSTR、和 REGEXP_REPLACE。它們在用法上與Oracle SQL 函式LIKE、INSTR、SUBSTR 和REPLACE 用法,但是它們使用POSIX 正規表示式代替了老的百分號(%)和萬用字元(_)字元。

  POSIX 正規表示式由標準的元字元(metacharacters)所構成:

  • '^' 表示字串的開始
  • '$' 表示字串的結束
  • '.' 表示任何字元
  • 字元的範圍,比如說'[a-z]',表示任何ASCII 小寫字母,與字元類"[[:lower:]]"" 等價
  • '?' 允許一個後繼字元匹配零次或一次
  • '+' 允許一個後繼字元匹配一次或多次
  • '*' 表示零次或多次

  可以使用"{m,n}" 指定一個精確地出現範圍,其意思是“出現從m 次到n 次”;"{m}" 表示“正好m次”;而"{m,}" 表示“至少m次”。還可以使用圓括號組合字元的集合,使用"|"(豎線)表示可替換。例如,字串'^([a-z]+|[0-9]+)$'將匹配所有由小寫字母或數字組合成的字串。

  REGEXP_LIKE 與LIKE 運算子相似。如果第一個引數匹配正規表示式它就解析為TRUE。例如WHERE REGEXP_LIKE(ENAME,'^J[AO]','i') 將在ENAME 以JA 或JO 開始的情況下返回一行資料。'I' 引數指定正規表示式是大小寫敏感的。另外還可以在CHECK 約束和函式索引中指定REGEXP_LIKE。例如:

ALTER TABLE EMP ADD CONSTRAINT REGEX01

CHECK (REGEXP_LIKE(ENAME,'^[[:alpha:]]+$'));

  這條語句使得ENAME 欄位只能包含字母和數字字元(也就是說沒有空格或者標點符號)。試圖插入或者更新這些資料將導致一個ORA-2290 異常,或者檢查約束的有效性。

REGEXP_INSTR 與INSTR 函式類似。它返回一個字串中匹配一個正規表示式的第一個子串的開始位置。例如:

  SELECT REGEXP_INSTR('The total is $400 for your purchase.','$[[:digit:]]+')

  FROM DUAL;

  這個查詢返回14,即$400在字串的開始位置。另外還可以指定子串出現的次數;開始搜尋的位置;是返回匹配的位置還是返回匹配之後字元的位置。

  REGEXP_SUBSTR 返回匹配一個正規表示式的子串。雖然結合使用SUBSTR 和REGEXP_INSTR 及LENGTH 也可以實現這一功能,但是使用這個函式卻更為簡單。

  SELECT REGEXP_INSTR('one,two,three','[^,]*') FROM DUAL;

  這個查詢返回'one',將第一個引數看成一個逗號分隔的列表並返回第一個逗號之前的所有字元。

  REGEXP_REPLACE 返回初始引數被匹配子串替換之後的結果。例如:

SELECT REGEXP_REPLACE('The temperature is 23°F',

'([[:digit:]])+°F',

('1'-32)*5/9||'°C')

FROM DUAL;

  這個查詢將查詢一個華氏溫度並將其轉換為攝氏度。它將返回:'The temperature is -5°C'。

ref:

[@more@]

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7916042/viewspace-889339/,如需轉載,請註明出處,否則將追究法律責任。

相關文章