20200110-正則表達式

在自動化辦公的時候,經常遇到需要通過正則表達式來處理文本。

 

1、環境是python, 開發工具是pycharm

2、需要導入re模組, 並且不需要安裝,直接導入即可使用, 用到方法; ref.findall(patter, str)

3、簡單語法介紹:

— re.findall(“aa”, str)  # 找找「aa」字元串

 

 

 

 

 

 

 

 — 查找除了換行以外的任何字元: .  

 

 

 

 

 

 

 — 查詢重複子: *: 代表0-多次重複,0次用「」表示

 

 

 

–查找重複字: + : 代表 1到多次重複

 

 

 

 — |: 代表或的關係: 查找aa 或者bb的字元:

 

 

 — []: 代表要匹配的字元,[0-9] 代表匹配0-9的數字;[a-z]: 代表匹配26個小寫英文字元;[A-Z]: 代表匹配26個大寫因為字元;[0-9a-zA-Z] 表示: 匹配0-數字26個大小寫因為字元都會被找出來

 

 

 — {m, n} 代表匹配幾次:表示匹配m次,到n次, 最少m次,最大m次; 和這幾個元字元比較相似: * 代表匹配{0,}; + 代表{1,};?代表:{0,1}

 

 

— ?代表:{0,1}

 

 

 — 匹配一個手機號, 特性: 11位、數字, 1開頭

 

 

 –匹配非字元: ^

 

 

 –匹配字元串的開頭:^; 匹配字元串的結尾: $

 

 

—  ? : 代表匹配前面表達式0-1次,即前面是小寫26個英文字母,加上?代表小寫字元出現0-1次都屬於匹配範圍

 

 

 

 

 — \d\D \d:匹配任何數字字元 \D:匹配任意非字元數字

 

 — 匹配任意(非)普通字元: \w: 代表普通字元(比如:數字字母下劃線漢字); \W:非普通 如:*&%¥#等

 

 —   匹配任意(非)空字元: \s: 匹配空字元 \S 匹配非空字元 說明: 空字元是指 空格\r\n\t\v\f字元