Python之‘pexels‘网站爬取下载图片
- 2019 年 12 月 18 日
- 笔记
导语
第一期小编给大家分享了京东商品图片爬虫的小项目,这次呢小编带来的还是图片爬虫的小项目,与上次不同的是下载图片所使用的技术是不同的,京东使用
urllib.request.urlretriver(url,filename) 下载;
这次是以二进制方式下载的
此次目标 url 为https://www.pexels.com/它为外国的一个免费图片的资源网站
相关文件
关注微信公众号‘爬虫康康’,公众号内回复‘pexels’获取源代码
开发工具及
环境搭建
Python版本:3.6.4
模块:requests time
bs4
multiprocessing
安装:pip安装相关模块
先睹为快


原理简介
1、访问目标:https://www.pexels.com/
2、请求使用 requests 访问 url
3、使用 bs4 提取图片 url
4、以二进制方式下载图片
5、创建文件夹保存下载图片
上面为项目的主要思路,小编自己进行了改进,开头给客户说明了怎么使用,其次可以让用户自行选择用完后是否终止程序还是继续下载。
下图为项目的主要框架结构

下图为此次下载图片所使用的技术

现在解释一下
先访问图片的 url,创建一个以要保存图片的名字命名的文件,以每张图片的后10个数字来命名,以二进制方式写入保存,最后写入完毕后关闭文件。