最近在研究爬虫,爬取好多网站的数据,下面就以爬取图片网站照片为例,来让大家学习,希望大家多交流。总的来说爬虫不难,会python的简单语法,会xpath提取网页需要的信息,就可以很快的爬取网站的图片,同时也希望以此来激起大家学习的兴趣。
文章导航一、环境二、源码三、部分源码分析3.1 获取网站html网页数据源码3.2 返回网页源码信息数据3.3 提取网页中自己需要的信息–有多少页3.4 循环进入某一页3.5 创建文件夹,循环进入每一个图片的第二层页面
一、环境
**目标网站:**图片网
**环境:**Python3.0以上版本 windows亲测可以,linux下应该也是没有问题
**第
1