輕鬆學習正則表達式

  • 2019 年 11 月 21 日
  • 筆記

轉載自:http://www.cnblogs.com/sxwgf/archive/2011/11/17/2252076.html

也許你是初學者,那以防萬一,我先來講講什麼是正則表達式吧:

正則表達式可以幫助我們更好的描述複雜的文本格式。一旦你描述清楚了這些格式,那你就可以利用它們對文本數據進行檢索、替換、提取和修改操作。

下面有一個正則表達式的簡單例子。第一步先要引入有關正則式的命名空間:

using System.Text.RegularExpressions;

第二步就是用指定的正則式構建一個正則表達式對象,下面的正則式是用來搜索長度為10的a-z的英文字母:

Regex obj = new Regex(「[a-z]{10}」);

最後,根據正則式在指定數據中檢索匹配項,如果匹配IsMatch方法就會返回true。

MessageBox.Show(obj.IsMatch(「shivkoirala」).ToString());

3個重要的正則式命令

記住正則語法最好的辦法就是記住這三樣東西:Bracket(括弧), caret(插入符號)和Dollars(美元符號)。

B

在正則表達式中有3種類型的括弧 方括弧 「[「和花括弧「{「 。 方括弧"["內是需要匹配的字元,花括弧"{"內是指定匹配字元的數量。 圓括弧「(「 則是用來分組的。

C

插入符號 「^」 表示正則式的開始。

D

美元符號「$」 表示正則式的結束。

現在你知道上面的3個語法後,你就可以寫世界上任何一條驗證規則了。比如下面的例子就很好的說明了上面3條正則語法是如何協調運作的。

(譯者註:上圖有個錯誤,"()"應為"{}")

  • 上面的這條正則式只能匹配a-z的英文字母,同樣是在中括弧中標明匹配範圍。
  • 花括弧中則是標明匹配字元串的最小長度和最大長度。
  • 最後為了讓表達式更規則,分別在開頭和結尾加上了插入符號"^"和美元符號"$"。

好了,現在我們就用上面的3條語法來實現一些正則表達式的驗證規則吧。

檢查用戶是否輸入了shivkoirala?

shivkoirala

讓我們開始第一個驗證,輸入的字元在a-g之間?

[a-g]

輸入的字元在a-g之間並且長度為3?

[a-g]{3}

輸入的字元在a-g之間並且最大長度為3最小長度為1?

[a-g]{1,3}

我如何在匹配像91230456, 01237648那樣的固定8位數?

^[0-9]{8}$

如何驗證最小長度為3最大長度為7的數字,如:123, 1274667, 87654?

^[0-9]{3,7}$

如何驗證像LJI1020那樣的發票編號,前3個是字母剩餘為8位長度的數字?

前三個是字母:

^[a-z]{3}

後面是8位長度的數字:

[0-9]{8}

所以整個表達式為:

^[a-z]{3}[0-9]{7}$

驗證像INV190203 或 inv820830那樣的前3位是不區分大小寫的英文字母,剩餘8位是數字

在前面的表達式中只能匹配前3個是小寫英文字母的發票編號,如果我們輸入大寫字母那就不能匹配了。所以為了確保前3個字母是不區分大小寫的,我們就要用表達式^[a-zA-Z]{3}。

完整的正則式如下:

^[a-zA-Z]{3}[0-9]{7}$

我們可以驗證簡單的網址URL格式嗎?

第一步:檢查是否存在www:

^www.

第二步:域名必須是長度在1-15的英文字母:

. [a-z]{1,15}

第三部:以.com或者.org結束:

. (com|org)$

完整的表達式如下:

^www[.][a-z]{1,15}[.](com|org)$

讓我們在來看看BCD(其實也就是上面說的3條基本語法)如何驗證email格式

第一步:email開始是長度在1-10的英文字母,最後跟一個"@":

^[a-zA-Z0-9]{1,10}@

第二步:@後面是長度在1-10的英文字母,後面跟一個".":

[a-zA-Z]{1,10}.

第三步:最後以.com或.org結束:

.(com|org)$

最後完整的表達式如下:

^[a-zA-Z0-9]{1,10}@[a-zA-Z]{1,10}.(com|org)$

驗證值在0-25的數字:

^(([0-9])|([0-1][0-9])|([0-2][0-5]))$

驗證格式為MM/DD/YYYY, YYYY/MM/DD and DD/MM/YYYY的日期:

步驟

正則式

描述說明

先來檢查 DD. 首先DD的長度為1-29 ( 2月份) , 1-30 (月小) , 1-31 (月大) . 所以 DD 就是 1-9 或 01-09

[1-9]|0[1-9]

允許用戶輸入1-9或者01-09.

再為DD添加匹配10-19

[1-9]|1[0-9]

允許用戶輸入01-19.

再為DD添加匹配20-29

[1-9]|1[0-9]|2[0-9]

允許用戶輸入01-29.

i再為DD添加匹配30-31

[1-9]|1[0-9]|2[0-9]|3[0-1]

最後用戶可以輸入01-31.

再來匹配日期間的分隔符"/","-"

[/ . -]

允許用戶輸入日期分隔符.

MM也是類似的操作

[1-9]|0[1-9]|1[0-2]

讓用戶輸入月份值01-12.

最後就是YY的操作

1[9][0-9][0-9]|2[0][0-9][0-9]

允許用戶輸入年份1900-2099.

最後DD/MM/YYYY格式的日期的正則表達式為:

^([1-9]|0[1-9]|1[0-9]|2[0-9]|3[0-1])[- / .]([1-9]|0[1-9]|1[0-2])[- / .](1[9][0-9][0-9]|2[0][0-9][0-9])$

MM/DD/YYYY格式的日期:

^([1-9]|0[1-9]|1[0-2])[- / .]([1-9]|0[1-9]|1[0-9]|2[0-9]|3[0-1])[- / .](1[9][0-9][0-9]|2[0][0-9][0-9])$

YYYY/MM/DD格式的日期:

^(1[9][0-9][0-9]|2[0][0-9][0-9])[- / .]([1-9]|0[1-9]|1[0-2])[- / .]([1-9]|0[1-9]|1[0-9]|2[0-9]|3[0-1])$

快捷命令

你也可以用以下的快捷命令來簡化你的正則表達式

實際命令

快捷命令

[0-9]

d

[a-z][0-9][_]

w

0次或多次發生

*

至少一次發生

+

0次或1次發生

?