【DB筆試面試461】Oracle中的常用正則表達式有哪些?

  • 2019 年 10 月 11 日
  • 筆記

題目部分

Oracle中的常用正則表達式有哪些?

答案部分

正則表達式就是以某種模式來匹配一類字符串。一旦概括了某類字符串,那麼正則表達式即可用於針對字符串的各種相關操作。例如,判斷匹配性,進行字符串的重新組合等。正則表達式提供了字符串處理的快捷方式。在Oracle 10g及以後的版本中也支持正則表達式。

元字符是指在正則表達式中表示特殊含義的字符,下表列出了所有的元字符及其含義:

表 3-6 Oracle中的元字符

元字符

含義

舉例

^

匹配輸入字符串的開始位置。

^a:匹配以a開始的字符串

$

匹配輸入字符串的結尾位置。如果設置了RegExp對象Multilin屬性,那麼$也匹配'n'或'r'

'a$':匹配以a結束的字符串

.

匹配除換行符n之外的任何單字符

?

匹配前面的子表達式零次或一次

tr(y(ing)?):可以匹配try或者trying

+

匹配前面的子表達式一次或多次

*

匹配前面的子表達式零次或多次

|

指明兩項之間的一個選擇

'^([a-z]+|[0-9]+)$':表示所有小寫字母或數字組合成的字符串

()

標記一個子表達式的開始和結束位置,即字符組。字符組是指將模式中的某些部分作為一個整體。這樣,量詞可以來修飾字符組,從而提高正則表達式的靈活性。字符組通過()來實現。在許多編程語言中,可以利用「$1」、「$2」等來獲取第一個、第二個字符組,即所謂的後向引用。在Oracle中,引用格式為「1」、「2」

a(b)*可以匹配ab、abb、abbb、youabb;(c|d)匹配c或d

[]

標記一個中括號表達式

[cd]匹配選擇c或d等同於(c|d)。匹配的是單字符,[^cd]是匹配c,d之外的單字符;[a-z]表示所有小寫字母;SS[PS]/[VS]匹配:SSP/V、SSP/S、SSS/V、SSS/S

{m,n}

一個精確地出現次數範圍,m=<出現次數<=n,「{m}」表示出現m次,「{m,}」表示至少出現m次

當使用在a-m時表示範圍;當使用在第一個字符時表示連續字符串,如[-abc]

Oracle字符類如下表所示:

表 3-7Oracle字符類表示

表示

含義

舉例

[[:alpha:]]

表示任意字母(包含漢字),正則表達式的一般語法為w,而且w包含數字

'^[[:alpha:]]+$':表示全是字符(字母和漢字),不包含數字、空格、標點符號

[[:digit:]]

表示任意數字,正則表達式的一般語法為d

'^[[:digit:]]+$':表示全是數字

[[:lower:]]

表示任意小寫字母

[[:upper:]]

表示任意大寫字母

[[:alnum:]]

表示任意字母和數字

[[:space:]]

表示任意空白字符,正則表達式的一般語法為s,即空格

[[:punct:]]

表示任意標點符號

[[:xdigit:]]

表示任意16進制的數字,相當於[0-9a-fA-F]

[:print:]

可打印字符

[:cntrl:]

控制字符(禁止打印)

Oracle中支持正則表達式的函數主要有下面四個:

v REGEXP_LIKE:與LIKE的功能相似

v REGEXP_INSTR:與INSTR的功能相似

v REGEXP_SUBSTR:與SUBSTR的功能相似

v REGEXP_REPLACE:與REPLACE的功能相似

它們在用法上與Oracle函數LIKE、INSTR、SUBSTR和REPLACE用法相同,但是它們使用POSIX正則表達式代替了老的百分號(%)和通配符(_)字符,如下表所示:

表 3-8 Oracle正則表達式函數

名稱

用途

語法

語法備註

舉例

REGEXP_LIKE

返回值為一個布爾值,可以作為WHERE條件,意味着前邊也可以加NOT來取其它情況。如果第一個參數匹配第二個參數所代表的正則表達式,那麼將返回真,否則將返回假

REGEXP_LIKE(source_string,pattern [,match_parameter])

source_string:源字符串Pattern:正則表達式match_parameter:匹配模式(i:不區分大小寫;c:區分大小寫;n:允許使用可以匹配任意字符串的操作符;m:將x作為一個包含多行的字符串)

SYS@lhrdb> SELECT ENAME,JOB FROM SCOTT.EMP WHERE REGEXP_LIKE(JOB,'(clerk|analyst)','i');ENAME JOB———- ———SMITH CLERKADAMS CLERKJAMES CLERKFORD ANALYST

REGEXP_REPLACE

將source_string中的按regexp匹配到的部分用replacement代替

REGEXP_REPLACE(source_string,pattern[,replace_string][,position][,occurtence][,match_parameter])

replace_string:用於替換的字符串position:開始搜索的起始位置occurtence:指定替換第n次出現字符串

SYS@lhrdb> SELECT REGEXP_REPLACE('09/29/2008','^([0-9]{2})/([0-9]{2})/([0-9]{4})$','3-1-2') REPLACES FROM DUAL;REPLACES———-2008-09-29

REGEXP_SUBSTR

REGEXP_SUBSTR(source_string,pattern[,position[,occurrence[,match_parameter]]])

position:指定在字符串中準確位置,默認為1occurrence:指定在源字符串匹配過程中相對其它字符串,哪個字符串應該匹配

SYS@lhrdb> SELECT REGEXP_SUBSTR('The zip code 80831 is for falcon, co','[[:alpha:]]{3,}',1,3) FROM DUAL;REGE—-codeSYS@lhrdb> SELECT REGEXP_SUBSTR('<a href= "http://mail.google.com/2009/1009.html">mail link</a>', 'http[a-zA-Z0-9.:/]*') URL FROM DUAL;URL————————————-http://mail.google.com/2009/1009.html

REGEXP_INSTR

返回找到的匹配字符串的位置,如果匹配不到則返回0

REGEXP_INSTR(source_string,pattern[,start_position[,occurrence[,return_option[,match_parameter]]]])

start_position:開始搜索位置Occurrence:第n次出現pattern,默認為1return_option:0:pattern的起始位置,默認為01:pattern下一個字符起始位置

SYS@lhrdb> SELECT REGEXP_INSTR('12.158', '.') POSITION FROM DUAL; POSITION———- 3

REGEXP_COUNT

Oracle 11g新增的函數,表示pattern在源字符串中出現的次數

REGEXP_COUNT(source_string,pattern[[,start_position][,match_parameter]])

start_position:開始搜索的位置

SYS@lhrdb> SELECT REGEXP_COUNT('23/56/78','/') FROM DUAL;REGEXP_COUNT('23/56/78','/')—————————- 2

本文選自《Oracle程序員面試筆試寶典》,作者:李華榮。

About Me:小麥苗

● 本文作者:小麥苗,只專註於數據庫的技術,更注重技術的運用

● 作者博客地址:http://blog.itpub.net/26736162/abstract/1/

● 本系列題目來源於作者的學習筆記,部分整理自網絡,若有侵權或不當之處還請諒解

● 版權所有,歡迎分享本文,轉載請保留出處

● 題目解答若有不當之處,還望各位朋友批評指正,共同進步