爬虫篇-如何下载selenium及其适配谷歌浏览器插件chromedriver(含chrome各版本及下载地址).doc
2022-07-08 14:06:10 8.62MB 技术资料
2020年3月14日 任务介绍 此次爬虫任务为“爬取新房销售信息”,获取楼盘名、地址、价格的简单信息,我选取的城市是“赣州”,尝试过安居客、房天下等几个房屋信息网站,安居客有反爬措施,由于是新手比较怂就果断避开了,从信息量来看房天下-赣州符合我的需要,且对新手比较友好,所以选择房天下为对象进行爬虫。 由于信息均为文本,选择保存为csv格式,便于后续读取和分析。 环境准备 我用的是Anaconda3的环境和PyCharm这种IDE工具,首先需要装载此次任务需要用到的函数库:Requests、bs4(BeautifulSoup4)、csv来实现以下功能: 爬取网页内容; 快速定位并获取想要的文本内
2021-12-27 18:01:38 731KB c csv fu
1
PYTHON思维导图-基础篇+入门爬虫篇(含正则表达式)PythonXMind.zip
2021-09-11 14:07:16 2.63MB PYTHON 思维导图 爬虫篇 正则表达式
1