20200110-正則表達式
- 2021 年 1 月 10 日
- 筆記
- python自動化辦公
在自動化辦公的時候,經常遇到需要通過正則表達式來處理文本。
1、環境是python, 開發工具是pycharm
2、需要導入re模組, 並且不需要安裝,直接導入即可使用, 用到方法; ref.findall(patter, str)
3、簡單語法介紹:
— re.findall(“aa”, str) # 找找「aa」字元串
— 查找除了換行以外的任何字元: .
— 查詢重複子: *: 代表0-多次重複,0次用「」表示
–查找重複字: + : 代表 1到多次重複
— |: 代表或的關係: 查找aa 或者bb的字元:
— []: 代表要匹配的字元,[0-9] 代表匹配0-9的數字;[a-z]: 代表匹配26個小寫英文字元;[A-Z]: 代表匹配26個大寫因為字元;[0-9a-zA-Z] 表示: 匹配0-數字26個大小寫因為字元都會被找出來
— {m, n} 代表匹配幾次:表示匹配m次,到n次, 最少m次,最大m次; 和這幾個元字元比較相似: * 代表匹配{0,}; + 代表{1,};?代表:{0,1}
— ?代表:{0,1}
— 匹配一個手機號, 特性: 11位、數字, 1開頭
–匹配非字元: ^
–匹配字元串的開頭:^; 匹配字元串的結尾: $
— ? : 代表匹配前面表達式0-1次,即前面是小寫26個英文字母,加上?代表小寫字元出現0-1次都屬於匹配範圍
— \d\D \d:匹配任何數字字元 \D:匹配任意非字元數字
— 匹配任意(非)普通字元: \w: 代表普通字元(比如:數字字母下劃線漢字); \W:非普通 如:*&%¥#等
— 匹配任意(非)空字元: \s: 匹配空字元 \S 匹配非空字元 說明: 空字元是指 空格\r\n\t\v\f字元