利用python爬虫对豆瓣和IMDB上的电影评价信息,并且最终通过图像可视化将IMDB250和豆瓣250的电影进行了比较,大致可以看出两个平台用户的电影审美水平
2019-12-21 19:24:17 5KB 爬虫
1
Python豆瓣爬虫以及爬虫爬好的图书分类数据,文件格式为xlsl,含分类、图书名、作者名、出版社、评分等信息
2019-12-21 19:23:59 12.34MB 豆瓣 图书 豆瓣图书 爬虫
1
爬虫获取的豆瓣电影短评,仅包含电影名,用户名,日期,评分,短评内容
2019-12-21 19:22:13 16.57MB 豆瓣电影 短评 情感分析 数据集
1
根据豆瓣所有的电影,分析各国各地区各类别时间年份评分数量等各个参数之间的联系,大体上进行分析,主要比较世界电影和中国,以及中国大陆和中国港台电影之间的差别,分析各参数之间是否存在关联性及对评分产生的影响;数据来源于豆瓣,我对评分不做主观表现,我只对数据进行分析展示,能力偏弱,但图像不弱。
2019-12-21 18:59:03 10.63MB 数据分析 python
1
通过爬虫获取的豆瓣最新华语电影数据,字段包括电影名称、上映年份、制片地区、语言、导演、类型、主演、上映日期、片长、评分、参会评分人数等。具体数据类型可参见我的博文:https://blog.csdn.net/weixin_43004311/article/details/82962159。数据截止日期为2018年9月。
2019-12-21 18:57:03 5.85MB 爬虫 豆瓣电影
1
豆瓣电影数据,经过详细的整理,可以将excel文件直接导入到sqlserver中,亲测可用
2019-12-21 18:54:41 11.43MB 电影数据
1
模仿豆瓣首页html前端源代码,前端学习,需要的可以down
2019-12-21 18:54:07 269KB Java w
1
(1)打开豆瓣一部电影评论区,根据html结构捕获三个信息: 一,每账号的评分等级为5星、4星、3星、2星、1星; 二,每个账号的评论留言; 三,跳转到下个评论页面的http链接 (2)获取所有的信息后对信息进行处理: 一,计算出每个星级的总数和一共多少账户进行了评级 二、将所有的评论内容放在一起,处理评论中的空格和其他不规范形式 (3)用matplotlib绘制评分等级占比的饼图,用jieba进行分词处理,用wordcloud生成词云图 同个修改url=https://movie.douban.com/subject/26430636/comments?start=0&limit=20&sort=new_score&status=P&percent;_type= 之中“26430636”为电影的代表,将其换做其他的编号就可以读取和生成其他电影的matplotlib和wordcloud制作评分图和词云图
2019-12-21 18:53:17 14KB python爬虫
1
Python关于豆瓣电影信息的爬虫,抓起1w条电影数据只要一分钟左右,
2019-12-21 18:53:12 2KB Python Movies MongoDB
1
爬取豆瓣上的电影,未去重之前有13W+去重后有12W+,辛苦爬了两天
2019-12-21 18:53:12 85.83MB DouBan MongoD
1