上传者: 38537777
|
上传时间: 2021-12-10 16:30:58
|
文件大小: 235KB
|
文件类型: -
一、选取网址进行爬虫
本次我们选取pixabay图片网站
url=https://pixabay.com/
二、选择图片右键选择查看元素来寻找图片链接的规则
通过查看多个图片路径我们发现取src路径都含有 https://cdn.pixabay.com/photo/ 公共部分且图片格式都为.jpg 因此正则表达式为
re.compile(r'^https://cdn.pixabay.com/photo/.*?jpg$')
通过以上的分析我们可以开始写程序了
#-*- coding:utf-8 -*-
import re
import requests
import os
fro