上传者: 38643141
|
上传时间: 2022-12-17 14:59:09
|
文件大小: 125KB
|
文件类型: PDF
文章概要
这是一个比较简单的爬虫项目,但是牵扯到一些python的基础知识,所以如果你是零基础的同学,也不用着急,先对爬虫有一个初步的认识,培养一个爬虫的正确思路是最重要的
网站地址:https://news.house.qq.com/a/20170702/003985.htm
要用到的模块:
requests:请求网站,获取网站的请求
bs4,re:解析网站,解析出你想要爬取的内容
xlwt:保存爬取下来的数据,对excel表格进行操作
开始撸代码
1.先把刚才安装的模块导入进来
import requests
import bs4
import re
import xlwt
2.自定义