文章目录 一、多线程爬取电影封面保存到本地 二、爬取电影的基本信息保存到Excel 查看各页面的url: 第一页:https://movie.douban.com/top250?start=0&filter= 第二页:https://movie.douban.com/top250?start=25&filter= 第三页:https://movie.douban.com/top250?start=50&filter= 第十页:https://movie.douban.com/top250?start=225&filter= 分析可得页面url的规律: url_list = [“https://
2021-12-06 16:16:51 290KB op p2 豆瓣
1
Python爬虫获取豆瓣网评分Top200的电影——亲测可用
2021-12-06 09:13:41 2KB python 爬虫
数据分析与挖掘案例之使用python抓取豆瓣top250电影数据进行分析-附件资源
2021-12-01 18:28:14 23B
1
《Spring+MyBatis企业应用实战》中文版,epub电子书,下载EPUB File Reader软件即可查看,内容可拷贝
2021-12-01 16:54:54 81.99MB Spring+MyBatis 豆瓣高分
1
简介 desc: 仿豆瓣评分小程序 author: 徐纯文
2021-11-30 20:25:55 130KB 微信 小程序
1
基于Lucene的电影搜索引擎 内容介绍 本文研究的主要内容是:面向电影搜索引擎的功能设计和技术实现。搜索引擎功能设计主要包括,信息资源的集成,查询扩展模块,Lucene检索模块,结果可视化。 信息资源的集成主要使用网络爬虫技术,利用java语言的regex包和selenium插件实现模拟登录以获取新浪微博,豆瓣电影,百度百科,相关新闻等不同数据源数据,以文档形式存储。查询扩展模块通过IKAnalayzer实现输入文本的分词和关键词的提取,为检索做准备。Lucene检索主要包括建立索引和对结果文档的排序。搜索结果可视化通过spring MVC框架搭建完整的系统实现。 技术实现主要包括:基于Lucene的全文检索技术,spring MVC框架,java爬虫技术,Python爬虫技术,html+css+JavaScript网页设计等。 实现流程详解 文本预处理 由于数据基本上都是中文的,Luc
2021-11-30 12:13:36 90.89MB Java
1
安卓仿豆瓣FM 卡片式滑动
2021-11-30 12:02:37 18.47MB 豆瓣FM 卡片式滑动
用于数据分析,可视化
2021-11-30 09:04:10 297KB 数据挖掘 数据分析
1
你想要的,这里都有。
2021-11-28 21:05:27 3.38MB python 爬虫 南京航空航天大学 豆瓣电影
1
刚接触python不久,做一个小项目来练练手。前几天看了《战狼2》,发现它在最新上映的电影里面是排行第一的,如下图所示。准备把豆瓣上对它的影评做一个分析。 目标总览 主要做了三件事: 抓取网页数据 清理数据 用词云进行展示 使用的python版本是3.5. 一、抓取网页数据 第一步要对网页进行访问,python中使用的是urllib库。代码如下: from urllib import request resp = request.urlopen('https://movie.douban.com/nowplaying/hangzhou/') html_data = resp.re
2021-11-28 01:51:05 789KB html代码 html语言 python
1