如何优雅的写好Pythonic代码?

  • 2019 年 11 月 21 日
  • 筆記

Python 与其它语言(比如Java或者C++)相比有比较大的区别,其中最大的特点就是非常简洁。如果按照其它语言的思路来写Python代码,则会使得代码繁琐复杂,并且容易出现Bug。在Python语言中,有个词很火,Pythonic。有的同学可能不明白这个词的意义,小编的理解就是用Python的写法写代码,而非是其它语言的通用的写法,写出Python的特点,写出Python的风格

下面,就通过几个示例来看一下不同思维的Python代码的差异。

1、变量值交换

这个问题最常见,大家从最开始写Java及C++等语言代码都会遇到这个问题。通常是通过一个临时变量来实现的:

tmp = a  a = b  b = tmp

而Python中可以直接交换两个变量,即:

a, b = b, a

2、列表推导式

列表推导式是Java及C++等语言没有的特性,能够很简洁的实现for循环,可以应用于列表,集合或者字典。

例如我们要求20以内的整除3的数的平方的列表,可以用如下代码实现:

numbers = []  for x in xrange(20):      if x % 3 == 0:          numbers.append(x*x)

而通过列表推导式一行代码即可实现:

numbers = [x*x for x in range(20) if x % 3 == 0]

列表推导式也可以用于集合和字典,将[…]变为{…}即可。集合和字典的实现如下所示:

集合:

numbers = {x * x for x in range(0, 20) if x % 3 == 0}

字典:

numbers = {x: x * x for x in range(0, 20) if x % 3 == 0}

3、字符串拼接

这是一个老生常谈的问题,当我们需要将数个字符串拼接的时候,习惯性的使用 "+" 作为连接字符串的手段。

然而,由于像字符串这种不可变对象在内存中生成后无法修改,合并后的字符串会重新开辟出一块内存空间来存储。因此每合并一次就会单独开辟一块内存空间,这样会占用大量的内存空间,严重影响代码的效率。

words = ['I', ' ', 'love', ' ', 'Python', '.']    sentence = ''  for word in words:      sentence += '' + word

解决这个问题的办法是使用字符串连接的join,Python写法如下:

words = ['I', ' ', 'love', ' ', 'Python', '.']    sentence = ''.join(words)

4、如何快速翻转字符串

Java或者C++等语言的写法是新建一个字符串,从最后开始访问原字符串:

a = 'I love Python.'    reverse_a = ''  for i in range(0, len(a)):      reverse_a += a[len(a) - i - 1]

而Python则将字符串看作list,而列表可以通过切片操作来实现反转:

a = 'I love Python.'  reverse_a = a[::-1]

5、for/else语句

在C语言或Java语言中,我们寻找一个字符是否在一个list中,通常会设置一个布尔型变量表示是否找到:

cities = ['BeiJing', 'TianJin', 'JiNan', 'ShenZhen', 'WuHan']  tofind = 'Shanghai'    found = False  for city in cities:      if tofind == city:          print 'Found!'          found = True          break  if not found:      print 'Not found!'

而Python中的通过for…else…会使得代码很简洁,注意else中的代码块仅仅是在for循环中没有执行break语句的时候执行:

cities = ['BeiJing', 'TianJin', 'JiNan', 'ShenZhen', 'WuHan']  tofind = 'Shanghai'    for city in cities:      if tofind == city:          print 'Found!'          break  else:      # 执行else中的语句意味着没有执行break      print 'Not found!'

6、迭代对象善用enumerate类

enumerate类接收两个参数,其中一个是可以迭代的对象,另外一个是开始的索引。比如,我们想要打印一个列表的索引及其内容,可以用如下代码实现:

cities = ['BeiJing', 'TianJin', 'JiNan', 'ShenZhen', 'WuHan']    index = 0  for city in cities:      index = index + 1      print index, ':', city

而通过使用enumerate则极大简化了代码,这里索引设置为从1开始(默认是从0开始):

cities = ['BeiJing', 'TianJin', 'JiNan', 'ShenZhen', 'WuHan']  for index, city in enumerate(cities, 1):      print index, ":", city

7、通过lambda来定义函数

lambda可以返回一个可以调用的函数对象,会使得代码更为简洁。若不使用lambda则需要单独定义一个函数:

def f(x):      return x * x    map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])

使用lambda后仅仅需要一行代码:

map(lambda x: x * x, [1, 2, 3, 4, 5, 6, 7, 8, 9])

这里注意,lambda生成的是一个可以像其他函数一样使用的函数对象,即

def f(x):      return x * x

等价于

lambda x: x * x

8、应用上下文管理

在打开文件时,通常是通过捕获异常来进行实现的,并且在finally模块中对文件来进行关闭:

try:      file = open('python.txt')      for line in file:          print line  except:      print "File error!"  finally:      file.close()

而通过上下文管理中的with语句可以让代码非常简洁:

with open('python.txt') as file:      for line in file:          print line

9、使用装饰器

装饰器在Python中应用特别广泛,其特点是可以在具体函数执行之前或者之后做相关的操作,比如:执行前打印执行函数的相关信息,对函数的参数进行校验;执行后记录函数调用的相关流水日志等。使用装饰器最大的好处是使得函数功能单一化,仅仅处理业务逻辑,而不附带其它功能

在函数调用前打印时间函数名相关的信息,不使用装饰器可以用如下代码实现:

from time import ctime    def foo():      print('[%s]  %s() is called' % (ctime(), foo.__name__))      print('Hello, Python')

这样写的问题是业务逻辑中会夹杂参数检查,日志记录等信息,使得代码逻辑不够清晰。所以,这种场景需要使用装饰器:

from time import ctime    def deco(func):      def decorator(*args, **kwargs):          print('[%s]  %s() is called' % (ctime(), func.__name__))          return func(*args, **kwargs)      return decorator    @deco  def foo():      print('Hello, Python')

10、使用生成器

生成器与列表最大的区别就是,列表是一次性生成的,需要较大的内存空间;而生成器是需要的时候生成的,基本不占用内存空间。生成器分为生成器表达式和生成器函数。

先看一下列表:

l = [x for x in range(10)]

改为生成器只需要将[…]变为(…),即

g = (x for x in range(10))

至于生成器函数,是通过yield关键字来实现的,我们以计算斐波那契数列为例,使用列表可以用如下代码来实现:

def fib(max):      n, a, b = 0, 0, 1      fibonacci = []      while n < max:          fibonacci.append(b)          a, b = b, a + b          n = n + 1      return fibonacci

而使用生成器则变为:

def fib(max):      n, a, b = 0, 0, 1      while n < max:          yield b          a, b = b, a + b          n = n + 1

11、Counter的使用

通常的词频统计中,我们的思路是:

需要一个字典,key值存储单词,value存储对应的词频。当遇到一个单词,判断是否在这个字典中,如果是,则词频加1;如果否,则字典中新增这个单词,同时对应的词频设置为1。

对应的Python代码实现如下:

#统计单词出现的频次  def computeFrequencies(wordList):      #词频字典      wordfrequencies = {}        for word in wordList:          if word not in wordfrequencies:              # 单词不在单词词频字典中, 词频设置为1              wordfrequencies[word] = 1          else:              # 单词在单词词频字典中, 词频加1              wordfrequencies[word] = wordfrequencies[word]  + 1       return wordfrequencies

有没有更简单的方式呢?答案是肯定的,就是使用Counter。collection 中的 Counter 类就完成了这样的功能,它是字典类的一个子类。Python代码变得无比简洁:

# 统计单词出现的频次  def computeFrequencies(wordList):      #词频字典      wordfrequencies = Counter(wordList)      return wordfrequencies

12、链式比较

在实际数字比较中,我们可能需要多次比较多次,比如我们判断学习成绩是否位于某个区间:

x = 79    >>> x < 80 and x > 70  True

而更Pythonic的写法变身链式比较,即:

x = 79    >>> 80 < x < 90  False    >>> 70 < x < 80  True

这种写法给人的感受也更为直观易懂。

13、函数返回多个值

在Java语言中,当函数需要返回多个值时,通常的做法是生成一个Response对象,然后将要返回的值写入对象内部。而Python不需要这样做,可以直接返回多个值:

def f():      error_code = 0      error_desc = "成功"      return error_code, error_desc

使用的时候也会非常简单:

code, desc = f()  print code, desc

14、使用*运算符

*运算符和** 运算符完美的解决了将元组参数、字典参数进行 unpack,从而简化了函数定义的形式,如:

def fun(*args):      for eacharg in args:          print 'tuple arg:', eacharg    fun('I', 'love', 'Python')

运行的结果为:

tuple arg: I

tuple arg: love

tuple arg: Python

15、找出列表中出现最多的数

这是经常会遇到的一个问题。解决这个问题的其中一个思路是按照标题11提供的词频统计的方法,先统计词频,然后遍历字典,找出具有最大词频的数字。有没有更简洁的方式?

当然,Python代码如下:

num = [1, 3, 3, 4, 5, 6, 3, 6, 6, 6]    print  max(set(num),key=num.count)

这些Pythonic的代码是否让你耳目一新?你还能写出哪些Pythonic的代码?在留言区跟大家分享一下吧!

本文来自公众号:python那些事

文部分来源网络,如有侵权请第一时间联系删除。