上传者: 38659955
|
上传时间: 2022-09-26 09:30:38
|
文件大小: 495KB
|
文件类型: PDF
基于之前两篇的基础知识后
python爬虫学习笔记(一)——初识爬虫
python爬虫学习笔记(二)——解析内容
开始实战爬取豆瓣TOP250电影
首先还是重新复习下爬虫的基本流程:
发起请求
获取响应内容
解析内容
保存数据
1. 发起请求
首先观察豆瓣电影Top250首页
(\s+)?’, ” “, bd)
bd = re.sub(‘/’, ” “, bd)
data.append(bd.strip()) # 添加相关内容
# 影片详情的链接的解析