python常用函数总结
- 2019 年 11 月 28 日
- 筆記
类型转换函数,操作系统相关的调用,系统相关的信息模块 ,操作系统相关的调用和操作 import os,操作举例,用os.path编写平台无关的程序,文件操作,regular expression 正则表达式 import re
- 1.常用内置函数:(不用import就可以直接使用)
- help(obj) 在线帮助, obj可是任何类型
- callable(obj) 查看一个obj是不是可以像函数一样调用
- repr(obj) 得到obj的表示字符串,可以利用这个字符串eval重建该对象的一个拷贝
- eval_r(str) 表示合法的python表达式,返回这个表达式
- dir(obj) 查看obj的name space中可见的name
- hasattr(obj,name) 查看一个obj的name space中是否有name
- getattr(obj,name) 得到一个obj的name space中的一个name
- setattr(obj,name,value) 为一个obj的name space中的一个name指向vale这个object
- delattr(obj,name) 从obj的name space中删除一个name
- vars(obj) 返回一个object的name space。用dictionary表示
- locals() 返回一个局部name space,用dictionary表示
- globals() 返回一个全局name space,用dictionary表示
- type(obj) 查看一个obj的类型
- isinstance(obj,cls) 查看obj是不是cls的instance
- issubclass(subcls,supcls) 查看subcls是不是supcls的子类
- 1.1类型转换函数
- chr(i) 把一个ASCII数值,变成字符
- ord(i) 把一个字符或者unicode字符,变成ASCII数值
- oct(x) 把整数x变成八进制表示的字符串
- hex(x) 把整数x变成十六进制表示的字符串
- str(obj) 得到obj的字符串描述
- list(seq) 把一个sequence转换成一个list
- tuple(seq) 把一个sequence转换成一个tuple
- dict(),dict(list) 转换成一个dictionary
- int(x) 转换成一个integer
- long(x) 转换成一个long interger
- float(x) 转换成一个浮点数
- complex(x) 转换成复数
- max(…) 求最大值
- min(…) 求最小值
- 用于执行程序的内置函数
- complie 如果一段代码经常要使用,那么先编译,再运行会更快。
- 2.和操作系统相关的调用
- 2.1 系统相关的信息模块 import sys
- sys.argv是一个list,包含所有的命令行参数.
- sys.stdout sys.stdin sys.stderr 分别表示标准输入输出,错误输出的文件对象.
- sys.stdin.readline() 从标准输入读一行 sys.stdout.write(“a”) 屏幕输出a
- sys.exit(exit_code) 退出程序
- sys.modules 是一个dictionary,表示系统中所有可用的module
- sys.platform 得到运行的操作系统环境
- sys.path 是一个list,指明所有查找module,package的路径.
- 2.2 操作系统相关的调用和操作 import os
- os.environ 一个dictionary 包含环境变量的映射关系 os.environ[“HOME”] 可以得到环境变量HOME的值
- os.chdir(dir) 改变当前目录 os.chdir(‘d:\outlook’) 注意windows下用到转义
- os.getcwd() 得到当前目录
- os.getegid() 得到有效组id os.getgid() 得到组id
- os.getuid() 得到用户id os.geteuid() 得到有效用户id
- os.setegid os.setegid() os.seteuid() os.setuid()
- os.getgruops() 得到用户组名称列表
- os.getlogin() 得到用户登录名称
- os.getenv 得到环境变量
- os.putenv 设置环境变量
- os.umask 设置umask
- os.system(cmd) 利用系统调用,运行cmd命令
- 2.3操作举例:
- os.mkdir(‘/tmp/xx’) os.system(“echo ‘hello’ > /tmp/xx/a.txt”) os.listdir(‘/tmp/xx’)
- os.rename(‘/tmp/xx/a.txt’,’/tmp/xx/b.txt’) os.remove(‘/tmp/xx/b.txt’) os.rmdir(‘/tmp/xx’)
- 用python编写一个简单的shell
- #!/usr/bin/python
- import os, sys
- cmd = sys.stdin.readline()
- while cmd:
- os.system(cmd)
- cmd = sys.stdin.readline()
- 2.4 用os.path编写平台无关的程序
- os.path.abspath(“1.txt”) == os.path.join(os.getcwd(), “1.txt”)
- os.path.split(os.getcwd()) 用于分开一个目录名称中的目录部分和文件名称部分。
- os.path.join(os.getcwd(), os.pardir, ‘a’, ‘a.doc’) 全成路径名称.
- os.pardir 表示当前平台下上一级目录的字符 ..
- os.path.getctime(“/root/1.txt”) 返回1.txt的ctime(创建时间)时间戳
- os.path.exists(os.getcwd()) 判断文件是否存在
- os.path.expanduser(‘~/dir’) 把~扩展成用户根目录
- os.path.expandvars(‘$PATH’) 扩展环境变量PATH
- os.path.isfile(os.getcwd()) 判断是否是文件名,1是0否
- os.path.isdir(‘c:Python26temp’) 判断是否是目录,1是0否
- os.path.islink(‘/home/huaying/111.sql’) 是否是符号连接 windows下不可用
- os.path.ismout(os.getcwd()) 是否是文件系统安装点 windows下不可用
- os.path.samefile(os.getcwd(), ‘/home/huaying’) 看看两个文件名是不是指的是同一个文件
- os.path.walk(‘/home/huaying’, test_fun, “a.c”)
- 遍历/home/huaying下所有子目录包括本目录,对于每个目录都会调用函数test_fun.
- 例:在某个目录中,和他所有的子目录中查找名称是a.c的文件或目录。
- def test_fun(filename, dirname, names): //filename即是walk中的a.c dirname是访问的目录名称
- if filename in names: //names是一个list,包含dirname目录下的所有内容
- print os.path.join(dirname, filename)
- os.path.walk(‘/home/huaying’, test_fun, “a.c”)
- 3.文件操作
- 打开文件
- f = open(“filename”, “r”) r只读 w写 rw读写 rb读二进制 wb写二进制 w+写追加
- 读写文件
- f.write(“a”) f.write(str) 写一字符串 f.writeline() f.readlines() 与下read类同
- f.read() 全读出来 f.read(size) 表示从文件中读取size个字符
- f.readline() 读一行,到文件结尾,返回空串. f.readlines() 读取全部,返回一个list. list每个元素表示一行,包含”n”
- f.tell() 返回当前文件读取位置
- f.seek(off, where) 定位文件读写位置. off表示偏移量,正数向文件尾移动,负数表示向开头移动。
- where为0表示从开始算起,1表示从当前位置算,2表示从结尾算.
- f.flush() 刷新缓存
- 关闭文件
- f.close()
- 4. regular expression 正则表达式 import re
- 简单的regexp
- p = re.compile(“abc”) if p.match(“abc”) : print “match”
- 上例中首先生成一个pattern(模式),如果和某个字符串匹配,就返回一个match object
- 除某些特殊字符metacharacter元字符,大多数字符都和自身匹配。
- 这些特殊字符是 。^ $ * + ? { [ ] | ( )
- 字符集合(用[]表示)
- 列出字符,如[abc]表示匹配a或b或c,大多数metacharacter在[]中只表示和本身匹配。例:
- a = “.^$*+?{\|()” 大多数metachar在[]中都和本身匹配,但”^[]”不同
- p = re.compile(“[“+a+”]”)
- for i in a:
- if p.match(i):
- print “[%s] is match” %i
- else:
- print “[%s] is not match” %i
- 在[]中包含[]本身,表示”[“或者”]”匹配.用[和]表示.
- ^出现在[]的开头,表示取反.[^abc]表示除了a,b,c之外的所有字符。^没有出现在开头,即于身身匹配。
- -可表示范围.[a-zA-Z]匹配任何一个英文字母。[0-9]匹配任何数字。
- 在[]中的妙用。
- d [0-9]
- D [^0-9]
- s [ tnrfv]
- S [^ tnrfv]
- w [a-zA-Z0-9_]
- W [^a-zA-Z0-9_]
- t 表示和tab匹配, 其他的都和字符串的表示法一致
- x20 表示和十六进制ascii 0x20匹配
- 有了,可以在[]中表示任何字符。注:单独的一个”.”如果没有出现[]中,表示出了换行n以外的匹配任何字符,类似[^n].
- regexp的重复
- {m,n}表示出现m个以上(含m个),n个以下(含n个). 如ab{1,3}c和abc,abbc,abbbc匹配,不会与ac,abbbc匹配。
- m是下界,n是上界。m省略表下界是0,n省略,表上界无限大。
- *表示{,} +表示{1,} ?表示{0,1}
- 最大匹配和最小匹配 python都是最大匹配,如果要最小匹配,在*,+,?,{m,n}后面加一个?.
- match object的end可以得到匹配的最后一个字符的位置。
- re.compile(“a*”).match(‘aaaa’).end() 4 最大匹配
- re.compile(“a*?”).match(‘aaaa’).end() 0 最小匹配
- 使用原始字符串
- 字符串表示方法中用\表示字符.大量使用影响可读性。
- 解决方法:在字符串前面加一个r表示raw格式。
- a = r”a” print a 结果是a
- a = r””a” print a 结果是”a
- 使用re模块
- 先用re.compile得到一个RegexObject 表示一个regexp
- 后用pattern的match,search的方法,得到MatchObject
- 再用match object得到匹配的位置,匹配的字符串等信息
- RegxObject常用函数:
- >>> re.compile(“a”).match(“abab”) 如果abab的开头和re.compile(“a”)匹配,得到MatchObject
- <_sre.SRE_Match object at 0x81d43c8>
- >>> print re.compile(“a”).match(“bbab”)
- None 注:从str的开头开始匹配
- >>> re.compile(“a”).search(“abab”) 在abab中搜索第一个和re_obj匹配的部分
- <_sre.SRE_Match object at 0x81d43c8>
- >>> print re.compile(“a”).search(“bbab”)
- <_sre.SRE_Match object at 0x8184e18> 和match()不同,不必从开头匹配
- re_obj.findall(str) 返回str中搜索所有和re_obj匹配的部分.
- 返回一个tuple,其中元素是匹配的字符串.
- MatchObject的常用函数
- m.start() 返回起始位置,m.end()返回结束位置(不包含该位置的字符).
- m.span() 返回一个tuple表示(m.start(), m.end())
- m.pos(), m.endpos(), m.re(), m.string()
- m.re().search(m.string(), m.pos(), m.endpos()) 会得到m本身
- m.finditer()可以返回一个iterator,用来遍历所有找到的MatchObject.
- for m in re.compile(“[ab]”).finditer(“tatbxaxb”):
- print m.span()
- 高级regexp
- | 表示联合多个regexp. A B两个regexp,A|B表示和A匹配或者跟B匹配.
- ^ 表示只匹配一行的开始行首,^只有在开头才有此特殊意义。
- $ 表示只匹配一行的结尾
- A 表示只匹配第一行字符串的开头 ^匹配每一行的行首
- Z 表示只匹配行一行字符串的结尾 $匹配第一行的行尾
- b 只匹配词的边界 例:binfob 只会匹配”info” 不会匹配information
- B 表示匹配非单词边界
- 示例如下:
- >>> print re.compile(r”binfob”).match(“info “) #使用raw格式 b表示单词边界
- <_sre.SRE_Match object at 0x817aa98>
- >>> print re.compile(“binfob”).match(“info “) #没有使用raw b表示退格符号
- None
- >>> print re.compile(“binfob”).match(“binfob “)
- <_sre.SRE_Match object at 0x8174948>
- 分组(Group) 示例:re.compile(“(a(b)c)d”).match(“abcd”).groups() (‘abc’, ‘b’)
- #!/usr/local/bin/python
- import re
- x = “””
- name: Charles
- Address: BUPT
- name: Ann
- Address: BUPT
- “””
- #p = re.compile(r”^name:(.*)n^Address:(.*)n”, re.M)
- p = re.compile(r”^name:(?P<name>.*)n^Address:(?P<address>.*)n”, re.M)
- for m in p.finditer(x):
- print m.span()
- print “here is your friends list”
- print “%s, %s”%m.groups()
- Compile Flag
- 用re.compile得到RegxObject时,可以有一些flag用来调整RegxObject的详细特征.
- DOTALL, S 让.匹配任意字符,包括换行符n
- IGNORECASE, I 忽略大小写
- LOCALES, L 让w W b B和当前的locale一致
- MULTILINE, M 多行模式,只影响^和$(参见上例)
- VERBOSE, X verbose模式
原创文章,转载请注明: 转载自URl-team
本文链接地址: python常用函数总结
No related posts.