【DB筆試面試461】Oracle中的常用正則表達式有哪些?
- 2019 年 10 月 11 日
- 筆記
題目部分
Oracle中的常用正則表達式有哪些?
答案部分
正則表達式就是以某種模式來匹配一類字符串。一旦概括了某類字符串,那麼正則表達式即可用於針對字符串的各種相關操作。例如,判斷匹配性,進行字符串的重新組合等。正則表達式提供了字符串處理的快捷方式。在Oracle 10g及以後的版本中也支持正則表達式。
元字符是指在正則表達式中表示特殊含義的字符,下表列出了所有的元字符及其含義:
表 3-6 Oracle中的元字符
元字符 |
含義 |
舉例 |
---|---|---|
^ |
匹配輸入字符串的開始位置。 |
^a:匹配以a開始的字符串 |
$ |
匹配輸入字符串的結尾位置。如果設置了RegExp對象Multilin屬性,那麼$也匹配'n'或'r' |
'a$':匹配以a結束的字符串 |
. |
匹配除換行符n之外的任何單字符 |
|
? |
匹配前面的子表達式零次或一次 |
tr(y(ing)?):可以匹配try或者trying |
+ |
匹配前面的子表達式一次或多次 |
|
* |
匹配前面的子表達式零次或多次 |
|
| |
指明兩項之間的一個選擇 |
'^([a-z]+|[0-9]+)$':表示所有小寫字母或數字組合成的字符串 |
() |
標記一個子表達式的開始和結束位置,即字符組。字符組是指將模式中的某些部分作為一個整體。這樣,量詞可以來修飾字符組,從而提高正則表達式的靈活性。字符組通過()來實現。在許多編程語言中,可以利用「$1」、「$2」等來獲取第一個、第二個字符組,即所謂的後向引用。在Oracle中,引用格式為「1」、「2」 |
a(b)*可以匹配ab、abb、abbb、youabb;(c|d)匹配c或d |
[] |
標記一個中括號表達式 |
[cd]匹配選擇c或d等同於(c|d)。匹配的是單字符,[^cd]是匹配c,d之外的單字符;[a-z]表示所有小寫字母;SS[PS]/[VS]匹配:SSP/V、SSP/S、SSS/V、SSS/S |
{m,n} |
一個精確地出現次數範圍,m=<出現次數<=n,「{m}」表示出現m次,「{m,}」表示至少出現m次 |
|
– |
當使用在a-m時表示範圍;當使用在第一個字符時表示連續字符串,如[-abc] |
|
Oracle字符類如下表所示:
表 3-7Oracle字符類表示
表示 |
含義 |
舉例 |
---|---|---|
[[:alpha:]] |
表示任意字母(包含漢字),正則表達式的一般語法為w,而且w包含數字 |
'^[[:alpha:]]+$':表示全是字符(字母和漢字),不包含數字、空格、標點符號 |
[[:digit:]] |
表示任意數字,正則表達式的一般語法為d |
'^[[:digit:]]+$':表示全是數字 |
[[:lower:]] |
表示任意小寫字母 |
|
[[:upper:]] |
表示任意大寫字母 |
|
[[:alnum:]] |
表示任意字母和數字 |
|
[[:space:]] |
表示任意空白字符,正則表達式的一般語法為s,即空格 |
|
[[:punct:]] |
表示任意標點符號 |
|
[[:xdigit:]] |
表示任意16進制的數字,相當於[0-9a-fA-F] |
|
[:print:] |
可打印字符 |
|
[:cntrl:] |
控制字符(禁止打印) |
|
Oracle中支持正則表達式的函數主要有下面四個:
v REGEXP_LIKE:與LIKE的功能相似
v REGEXP_INSTR:與INSTR的功能相似
v REGEXP_SUBSTR:與SUBSTR的功能相似
v REGEXP_REPLACE:與REPLACE的功能相似
它們在用法上與Oracle函數LIKE、INSTR、SUBSTR和REPLACE用法相同,但是它們使用POSIX正則表達式代替了老的百分號(%)和通配符(_)字符,如下表所示:
表 3-8 Oracle正則表達式函數
名稱 |
用途 |
語法 |
語法備註 |
舉例 |
|
---|---|---|---|---|---|
REGEXP_LIKE |
返回值為一個布爾值,可以作為WHERE條件,意味着前邊也可以加NOT來取其它情況。如果第一個參數匹配第二個參數所代表的正則表達式,那麼將返回真,否則將返回假 |
REGEXP_LIKE(source_string,pattern [,match_parameter]) |
source_string:源字符串Pattern:正則表達式match_parameter:匹配模式(i:不區分大小寫;c:區分大小寫;n:允許使用可以匹配任意字符串的操作符;m:將x作為一個包含多行的字符串) |
SYS@lhrdb> SELECT ENAME,JOB FROM SCOTT.EMP WHERE REGEXP_LIKE(JOB,'(clerk|analyst)','i');ENAME JOB———- ———SMITH CLERKADAMS CLERKJAMES CLERKFORD ANALYST |
|
REGEXP_REPLACE |
將source_string中的按regexp匹配到的部分用replacement代替 |
REGEXP_REPLACE(source_string,pattern[,replace_string][,position][,occurtence][,match_parameter]) |
replace_string:用於替換的字符串position:開始搜索的起始位置occurtence:指定替換第n次出現字符串 |
SYS@lhrdb> SELECT REGEXP_REPLACE('09/29/2008','^([0-9]{2})/([0-9]{2})/([0-9]{4})$','3-1-2') REPLACES FROM DUAL;REPLACES———-2008-09-29 |
|
REGEXP_SUBSTR |
|
REGEXP_SUBSTR(source_string,pattern[,position[,occurrence[,match_parameter]]]) |
position:指定在字符串中準確位置,默認為1occurrence:指定在源字符串匹配過程中相對其它字符串,哪個字符串應該匹配 |
SYS@lhrdb> SELECT REGEXP_SUBSTR('The zip code 80831 is for falcon, co','[[:alpha:]]{3,}',1,3) FROM DUAL;REGE—-codeSYS@lhrdb> SELECT REGEXP_SUBSTR('<a href= "http://mail.google.com/2009/1009.html">mail link</a>', 'http[a-zA-Z0-9.:/]*') URL FROM DUAL;URL————————————-http://mail.google.com/2009/1009.html |
|
REGEXP_INSTR |
返回找到的匹配字符串的位置,如果匹配不到則返回0 |
REGEXP_INSTR(source_string,pattern[,start_position[,occurrence[,return_option[,match_parameter]]]]) |
start_position:開始搜索位置Occurrence:第n次出現pattern,默認為1return_option:0:pattern的起始位置,默認為01:pattern下一個字符起始位置 |
SYS@lhrdb> SELECT REGEXP_INSTR('12.158', '.') POSITION FROM DUAL; POSITION———- 3 |
|
REGEXP_COUNT |
Oracle 11g新增的函數,表示pattern在源字符串中出現的次數 |
REGEXP_COUNT(source_string,pattern[[,start_position][,match_parameter]]) |
start_position:開始搜索的位置 |
SYS@lhrdb> SELECT REGEXP_COUNT('23/56/78','/') FROM DUAL;REGEXP_COUNT('23/56/78','/')—————————- 2 |
|
本文選自《Oracle程序員面試筆試寶典》,作者:李華榮。
About Me:小麥苗
● 本文作者:小麥苗,只專註於數據庫的技術,更注重技術的運用
● 作者博客地址:http://blog.itpub.net/26736162/abstract/1/
● 本系列題目來源於作者的學習筆記,部分整理自網絡,若有侵權或不當之處還請諒解
● 版權所有,歡迎分享本文,轉載請保留出處
● 題目解答若有不當之處,還望各位朋友批評指正,共同進步