Python3 实现大众点评网酒店信息和酒店评论的网页爬虫

上传者: 22107075 | 上传时间: 2020-01-03 11:29:38 | 文件大小: 16KB | 文件类型: zip
内容: 根据已有的的"大众点评网"酒店主页的URL地址,自动抓取所需要的酒店的名称、图片、经纬度、酒店价格、用户评论数量以及用户评论的用户ID、用户名字、评分、评论时间等,并且将爬取成功的内容存放到.txt文档中。 平台:Python 3.5.3;Eclipse for Pydev 主程序:DianpingSpider.py 注意:设置了时间,模拟器等,较为有效地防止大众点评网的反爬虫结束检测到同一个IP访问频繁而屏蔽爬取,但是未能实现IP代理。

文件下载

资源详情

[{"title":"( 11 个子文件 16KB ) Python3 实现大众点评网酒店信息和酒店评论的网页爬虫","children":[{"title":"DianPingSpider","children":[{"title":"PriceAndScores.py <span style='color:#111;'> 1.05KB </span>","children":null,"spread":false},{"title":"DianpingSpider.py <span style='color:#111;'> 9.15KB </span>","children":null,"spread":false},{"title":"picture.py <span style='color:#111;'> 1.01KB </span>","children":null,"spread":false},{"title":"urlspider.py <span style='color:#111;'> 1.72KB </span>","children":null,"spread":false},{"title":"__pycache__","children":[{"title":"__init__.cpython-35.pyc <span style='color:#111;'> 5.74KB </span>","children":null,"spread":false},{"title":"picture.cpython-35.pyc <span style='color:#111;'> 977B </span>","children":null,"spread":false},{"title":"position.cpython-35.pyc <span style='color:#111;'> 1.51KB </span>","children":null,"spread":false},{"title":"test.cpython-35.pyc <span style='color:#111;'> 388B </span>","children":null,"spread":false},{"title":"urlspider.cpython-35.pyc <span style='color:#111;'> 1.50KB </span>","children":null,"spread":false},{"title":"PriceAndScores.cpython-35.pyc <span style='color:#111;'> 1.06KB </span>","children":null,"spread":false}],"spread":true},{"title":"image","children":null,"spread":false},{"title":"position.py <span style='color:#111;'> 1.39KB </span>","children":null,"spread":false},{"title":"hotel","children":null,"spread":false}],"spread":true}],"spread":true}]

评论信息

  • koreyshi :
    爬出来的数据保存的文件在哪?
    2019-08-28
  • MrCao杰罗尔德 :
    FileNotFoundError: [Errno 2] No such file or directory: 'HotelUrl.txt'
    2018-08-10
  • sinat_38061754 :
    所以爬出来的数据保存的文件在哪呢
    2018-04-17
  • wyx100 :
    TypeError: argument of type 'NoneType' is not iterable
    2018-01-16
  • qq_35620935 :
    都失败了,细碎socket.gaierror: [Errno 11001] getaddrinfo failed urllib.error.URLError: &lt;urlopen error [
    2018-01-15

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明