上传者: 38547035
|
上传时间: 2022-12-15 18:46:39
|
文件大小: 353KB
|
文件类型: PDF
本文实例讲述了Python利用Scrapy框架爬取豆瓣电影。分享给大家供大家参考,具体如下:
1、概念
Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。
通过Python包管理工具可以很便捷地对scrapy进行安装,如果在安装中报错提示缺少依赖的包,那就通过pip安装所缺的包
pip install scrapy
scrapy的组成结构如下图所示
引擎Scrapy Engine,用于中转调度其他部分的信号和数据传递
调度器Scheduler,一个存储Request的队列,引擎将请求的连接发送给Schedu