本源码虽然简单,但是很形象的给大家介绍了一个简单的爬虫和递归算法。
供大家学习交流使用
思路:
百度搜索关键词
采集所有页面地址并过滤常见网站(新浪 腾讯 网易之类的)
取出所有链接 取出所有图片链接
对链接按照规则进行过滤(二维码是否精确主要看这个)
将采集到的链接重复@处以下的步骤直到没有可以采集的链接为止
主要问题在于过滤部分,大家可以根据普遍存在的规律过滤掉不是二维码的图片,之后批量下载、
(仅供学习交流使用,没有加下载功能,可以直接http读文件后写出,也可以复制后用迅雷批量下载)
2021-12-30 17:59:19
194KB
网络相关源码
1