上传者: 38528680
|
上传时间: 2021-07-31 15:02:51
|
文件大小: 1.56MB
|
文件类型: PDF
python网络爬虫(批量爬取网页图片),主要使用requests库和BeautifulSoup库,没有的请先去安装。
接下来我会完整地分析整个爬取的过程,本次以http://www.netbian.com/该网站为例,网站页面如下:
首先我们分析一下爬取的过程,先看第一张图片
查看网页代码(F12):
可以发现该图片链接的地址,点击该图片进入以下界面:
找到图片的下载地址,点击进入可以找到分辨率最大的原图,如下红圈圈出的便是我们要找到的最终下载图片的地址:
代码及说明如下:
#1.导入requests和BeautifulSoup库
import requests
from b