京东688的selenium爬虫项目.zip

上传者: 44422604 | 上传时间: 2022-05-20 10:09:33 | 文件大小: 199.7MB | 文件类型: ZIP
功能介绍 京东与1688项目两个项目具有极高的相似度,我首先写的京东爬虫,再写的1688爬虫,1688爬虫基于京东爬虫的构建思路,因此1688爬虫会比京东爬虫更深入,两者也会有一些重复的部分。 1、selenium反侦察。通过自动化工具,可以模拟正常人类的操作,但还是会有一些检测方式,可以检查到selenium之类的工具。这两个项目里配置了一个Chrome浏览器选项,开启了浏览器开发者模式,防止被爬网站通过js代码检查到自动化工具。可能还会有其他的反侦察方法,待我们继续深挖。 2、输入关键字查询,爬取显示页面所有商品。京东项目里面会爬取每个商品的商品名、店铺、价格、好评率。1688项目爬取分两部分,一个商品,一个店铺。商品里包括的信息:商品名、店铺地址、价格(以json字符串存入的数据库)、搜索关键字。店铺里包括的信息:店铺地址、店铺名、货描、响应、发货速度。 3、1688项目有店铺去重的功能。在搜索页面中,有许多店铺重复了,这里用redis的set保存了店铺的地址,如果店铺地址没有在set中,那就插入mysql数据库,反之则不插入。 4、1688项目异常处理。有些地方数据解析不到,解析不到就跳过当前的解析,进行下一次解析,不会出现程序运行停止的情况。 另外内含详细截图+详细部署视频,还对过程中可能出现的问题进行了汇总,对于正在学习这方面的你是一个很好的选择,希望对你有所帮助。

文件下载

资源详情

[{"title":"( 11 个子文件 199.7MB ) 京东688的selenium爬虫项目.zip","children":[{"title":"京东688的selenium爬虫项目","children":[{"title":"1688项目分析.mkv <span style='color:#111;'> 203.42MB </span>","children":null,"spread":false},{"title":"1688","children":[{"title":"1688_spider.py <span style='color:#111;'> 9.00KB </span>","children":null,"spread":false},{"title":"mysqlUse.py <span style='color:#111;'> 2.13KB </span>","children":null,"spread":false},{"title":"__pycache__","children":[{"title":"save2Redis.cpython-37.pyc <span style='color:#111;'> 830B </span>","children":null,"spread":false},{"title":"mysqlUse.cpython-37.pyc <span style='color:#111;'> 2.22KB </span>","children":null,"spread":false}],"spread":true},{"title":"save2Redis.py <span style='color:#111;'> 491B </span>","children":null,"spread":false},{"title":"a.html <span style='color:#111;'> 1.18MB </span>","children":null,"spread":false}],"spread":true},{"title":"Readme.txt <span style='color:#111;'> 1.73KB </span>","children":null,"spread":false},{"title":"JD","children":[{"title":"mysqlUse.py <span style='color:#111;'> 1.11KB </span>","children":null,"spread":false},{"title":"jdInfo.py <span style='color:#111;'> 5.42KB </span>","children":null,"spread":false},{"title":"__pycache__","children":[{"title":"mysqlUse.cpython-37.pyc <span style='color:#111;'> 1.34KB </span>","children":null,"spread":false}],"spread":true}],"spread":true}],"spread":true}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明