小白学 Python(21):生成器基础
- 2019 年 11 月 14 日
- 筆記
人生苦短,我选Python
前文传送门
生成器
我们前面聊过了为什么要使用迭代器,各位同学应该还有印象吧(说没有的就太过分了)。
列表太大的话会占用过大的内存,可以使用迭代器,只拿出需要使用的部分。
生成器的设计原则和迭代器是相似的,如果需要一个非常大的集合,不会将元素全部都放在这个集合中,而是将元素保存成生成器的状态,每次迭代的时候返回一个值。
比如我们要生成一个列表,可以采用如下方式:
list1 = [x*x for x in range(10)] print(list1)
结果如下:
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
如果我们生成的列表非常的巨大,比如:
list2 = [x*x for x in range(1000000000000000000000000)]
结果如下:
Traceback (most recent call last): File "D:/Development/Projects/python-learning/base-generator/Demo.py", line 3, in <module> list2 = [x*x for x in range(1000000000000000000000000)] File "D:/Development/Projects/python-learning/base-generator/Demo.py", line 3, in <listcomp> list2 = [x*x for x in range(1000000000000000000000000)] MemoryError
报错了,报错信息提示我们存储异常,并且整个程序运行了相当长一段时间。友情提醒,这么大的列表创建请慎重,如果电脑配置不够很有可能会将电脑卡死。
如果我们使用生成器就会非常方便了,而且执行速度嗖嗖的。
generator1 = (x*x for x in range(1000000000000000000000000)) print(generator1) print(type(generator1))
结果如下:
<generator object <genexpr> at 0x0000014383E85B48> <class 'generator'>
那么,我们使用了生成器以后,怎么读取生成器生成的数据呢?
当然是和之前的迭代器一样的拉,使用 next()
函数:
generator2 = (x*x for x in range(3)) print(next(generator2)) print(next(generator2)) print(next(generator2)) print(next(generator2))
结果如下:
Traceback (most recent call last): File "D:/Development/Projects/python-learning/base-generator/Demo.py", line 14, in <module> print(next(generator2)) StopIteration
直到最后,抛出 StopIteration
异常。
但是,这种使用方法我们并不知道什么时候会迭代结束,所以我们可以使用 for 循环来获取每生成器生成的具体的元素,并且使用 for 循环同时也无需关心最后的 StopIteration
异常。
generator3 = (x*x for x in range(5)) for index in generator3: print(index)
结果如下:
0 1 4 9 16
generator
非常的强大,本质上, generator
并不会取存储我们的具体元素,它存储是推算的算法,通过算法来推算出下一个值。
如果推算的算法比较复杂,用类似列表生成式的 for 循环无法实现的时候,还可以用函数来实现。
比如我们定义一个函数,emmmmmm,还是简单点吧,大家领会精神:
def print_a(max): i = 0 while i < max: i += 1 yield i a = print_a(10) print(a) print(type(a))
结果如下:
<generator object print_a at 0x00000278C6AA5CC8> <class 'generator'>
这里使用到了关键字 yield
, yield
和 return
非常的相似,都可以返回值,但是不同的是 yield
不会结束函数。
我们调用几次这个用函数创建的生成器:
print(next(a)) print(next(a)) print(next(a)) print(next(a))
结果如下:
1 2 3 4
可以看到,当我们使用 next() 对生成器进行一次操作的时候,会返回一次循环的值,在 yield
这里结束本次的运行。但是在下一次执行 next() 的时候,会接着上次的断点接着运行。直到下一个 yield
,并且不停的循环往复,直到运行至生成器的最后。
还有一种与 next() 等价的方式,直接看示例代码吧:
print(a.__next__()) print(a.__next__())
结果如下:
5 6
接下来要介绍的这个方法就更厉害了,不仅能迭代,还能给函数再传一个值回去:
def print_b(max): i = 0 while i < max: i += 1 args = yield i print('传入参数为:' + args) b = print_b(20) print(next(b)) print(b.send('Python'))
结果如下:
1 传入参数为:Python 2
上面讲了这么多,可能各位还没想到生成器能有什么具体的作用吧,这里我来提一个——协程。
在介绍什么是协程之前先介绍下什么是多线程,就是在同一个时间内可以执行多个程序,简单理解就是你平时可能很经常的一边玩手机一边听音乐(毫无违和感)。
协程更贴切的解释是流水线,比如某件事情必须 A 先做一步, B 再做一步,并且这两件事情看起来要是同时进行的。
def print_c(): while True: print('执行 A ') yield None def print_d(): while True: print('执行 B ') yield None c = print_c() d = print_d() while True: c.__next__() d.__next__()
结果如下:
... 执行 A 执行 B 执行 A 执行 B 执行 A 执行 B 执行 A 执行 B 执行 A 执行 B ...
因为 while
条件设置的是永真,所以这个循环是不会停下来的。
这里我们定义了两个生成器,并且在一个循环中往复的调用这两个生成器,这样看起来就是两个任务在同时执行。
最后的协程可能理解起来稍有难度,有问题可以在公众号后台问我哦~~~
示例代码
本系列的所有代码小编都会放在代码管理仓库 Github 和 Gitee 上,方便大家取用。