效果图:
1.工先利其事必先利器,首先我们得下载相应的库:
pip install requests
pip install lxml
pip install xlwt
requests 向网页发送请求
lxml 处理xml文件(xpath)
xlwt 对Excel做写入操作
2.爬取b站热门视频的信息:
打开b站热门视频页面:
按f12进入开发者选项,然后点击选中你要获取的页面信息,即可找到该信息在该HTML文件中的什么位置(这对我们用xpath获取元素属性和元素值很重要),例如:
代码如下:
# 爬取b站热门视频信息
def spider(video_list):
2022-05-13 00:17:42
635KB
c
ce
表格
1