發現一個很棒的壁紙網站，所以我們應該把它爬取下來

2020 年 10 月 24 日
筆記
10月

前言

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯繫我們以作處理

最近又發現了一個很棒的壁紙網站

環境

Python3.6
pycharm

本次目標

爬取網站高清

網站地址

//wallhaven.cc/

爬蟲程式碼

導入工具

import requests
import re

請求網站

url = '//wallhaven.cc/toplist?page={}'.format(page)
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

解析網站數據

for i in urls:
    response_2 = requests.get(url=i, headers=headers)
    img_url = re.findall('<img id="wallpaper" src="(.*?)"', response_2.text, re.S)[0]
    title = img_url.split('-')[-1]
    download(title, img_url)

保存數據

def download(title, url):
    path = '保存地址' + title
    response = requests.get(url=url)
    with open(path, mode='wb') as f:
        f.write(response.content)

Tags: 10月

發現一個很棒的壁紙網站，所以我們應該把它爬取下來

前言

環境

本次目標

爬蟲程式碼

VirMach 便宜 VPS

QNews

發現一個很棒的壁紙網站，所以我們應該把它爬取下來

前言

環境

本次目標

爬蟲程式碼

分享此文：

Related Posts

Serverless實踐系列（九）：「灰常」簡單的車牌識別 API 製作

postman介面自動化測試之利用node.js和xmysql連接、操作資料庫

leetcode最大子序和（python）

營收罕見下滑！官方發聲：未來十年 就靠中國了

VirMach 便宜 VPS

QNews

熱門文章

熱門搜尋

營收罕見下滑！官方發聲：未來十年就靠中國了