通过python爬去豆瓣网的数据,用大数据基础对数据进行清洗,然后对清洗的数据可视化,更直观的展示出来
2019-12-21 20:53:23 367KB 数据爬取 数据分析  数据可视化
1
豆瓣电影数据集12万+用户影评40万+爬虫程序(两个csv,一个db数据库) 最近在学习爬虫,辛辛苦苦爬了几天,分享给大家。。可以用来做推荐系统 觉得好的朋友帮忙评论下打个5星~ 可以看下这篇文章 https://blog.csdn.net/qq_37717661/article/details/81458779
2019-12-21 20:48:11 42.45MB 数据集 豆瓣 爬虫
1
豆瓣电影数据集(截至2019年3月),共91369条。 包含[电影名称,评分,评价人数,各星级占比,短评数量,影评数量,类型,导演,编剧,主演,制片国家/地区,语言,上映日期,片长,网址,剧情简介]
2019-12-21 19:56:55 36.57MB Data s
1
豆瓣爬虫加10万条电影数据集,用户数据集,影评数据集
2019-12-21 19:35:48 40.02MB database set 数据集 电影数据
1
本人花2天时间学习简单http协议然后写了个破代码在imdb上爬取了MovieLens数据集的配图,由于MovieLens中的数据集链接已失效,所以只能根据imdb网站的搜索引擎慢慢爬取图片。希望对毕设为推荐系统的童鞋有些许作用。。。
2019-12-21 19:31:19 27.19MB movieLens 数据集 电影网站
1
mysql脚本直接在数据库中执行就行,如有执行不成功的,请自行查看下原因
2019-12-21 19:25:18 1.68MB sql脚本
1
通过爬虫获取的豆瓣最新华语电影数据,字段包括电影名称、上映年份、制片地区、语言、导演、类型、主演、上映日期、片长、评分、参会评分人数等。具体数据类型可参见我的博文:https://blog.csdn.net/weixin_43004311/article/details/82962159。数据截止日期为2018年9月。
2019-12-21 18:57:03 5.85MB 爬虫 豆瓣电影
1
豆瓣电影数据,经过详细的整理,可以将excel文件直接导入到sqlserver中,亲测可用
2019-12-21 18:54:41 11.43MB 电影数据
1