­

Python之‘pexels‘网站爬取下载图片

  • 2019 年 12 月 18 日
  • 笔记

导语

第一期小编给大家分享了京东商品图片爬虫的小项目,这次呢小编带来的还是图片爬虫的小项目,与上次不同的是下载图片所使用的技术是不同的,京东使用

urllib.request.urlretriver(url,filename) 下载;

这次是以二进制方式下载的

此次目标 url 为https://www.pexels.com/它为外国的一个免费图片的资源网站

相关文件

关注微信公众号‘爬虫康康’,公众号内回复‘pexels’获取源代码

开发工具及

环境搭建

Python版本:3.6.4

模块:requests time

bs4

multiprocessing

安装:pip安装相关模块

先睹为快

原理简介

1、访问目标:https://www.pexels.com/

2、请求使用 requests 访问 url

3、使用 bs4 提取图片 url

4、以二进制方式下载图片

5、创建文件夹保存下载图片

上面为项目的主要思路,小编自己进行了改进,开头给客户说明了怎么使用,其次可以让用户自行选择用完后是否终止程序还是继续下载。

下图为项目的主要框架结构

下图为此次下载图片所使用的技术

现在解释一下

先访问图片的 url,创建一个以要保存图片的名字命名的文件,以每张图片的后10个数字来命名,以二进制方式写入保存,最后写入完毕后关闭文件。