一、题目 从网络上下载一组数据(自行获取),选择一种可视化工具(Excel、Tableau、Matlab,Echarts等),设计一种可视化方案实现该数据的可视化,并做适当的数据分析(或挖掘)。 二、数据来源 ①、TMDB 5000 Movie Dataset:该数据来源于kaggle上的TMDB 5000 Movie Dataset数据集,收录了美国地区1916-2017年近5000部电影的数据,包含预算、导演、票房,电影评分等信息。 下载地址:https://www.kaggle.com/tmdb/tmdb-movie-metadata ②、豆瓣电影数据:该数据是我自己整理的,收录了豆瓣电影1922-2022年近550部电影的数据,包含评分人数、电影评分、票房,产地等信息。 三、说明 资源包含数据可视化技术大作业报告,相关的电影数据集:TMDB 5000 Movie Dataset和豆瓣电影数据。使用的可视化工具是:Tableau。
2023-12-03 12:02:34 5.63MB Tableau 数据可视化 豆瓣电影数据集
1
python数据挖掘电影评分分析-豆瓣电影数据与票房数据分析.pdf
2022-12-28 10:00:36 819KB 文档资料
1
练习Tableau的数据源
2022-12-13 15:08:36 2.36MB Tableau
1
豆瓣电影数据(id,标题,连接地址,评分,演员,导演....)12W+(已去重) 格式为json
2022-11-21 14:14:42 9.14MB 豆瓣 豆瓣id 豆瓣json数据
1
【字段】 电影名称、投票人数、类型、产地、上映时间、时长、年代、评分、首映地点 【用途】 该数据集非常适用了Python数据分析入门,是学习NumPy 、Pandas、Matplotlib的练手数据集
2022-06-26 19:09:06 2.92MB 数据分析 python 人工智能 数据挖掘
豆瓣用户每天都在对“看过”的电影进行“很差”到“力荐”的评价,豆瓣根据每部影片看过的人数以及该影片所得的评价等综合数据,通过算法分析产生豆瓣电影 Top 250。 为了分析电影产业的发展趋势,本次实验需要对这些信息做统计分析。 注意:豆瓣网站的数据形式为文本文件(必须将导入到hive中做处理)。也可以为CSV文件,例如下图: 针对本次实验,我们需要用到Hadoop集群作为模拟大数据的分析软件,集群环境必须要包括,hdfs,hbase,hive,flume,sqoop等插件,最后结合分析出来的数据进行可视化展示,需要用到Python(爬取数据集,可视化展示)或者echarts等可视化工具。
Hadoop豆瓣电影数据分析(Hadoop)操作源码
2022-06-17 09:10:52 7KB Hadoop
movie_recommend 电影推荐系统-基于豆瓣电影数据
2022-05-16 13:10:52 36.81MB HTML
1
豆瓣电影相关数据集有12W,用户的影评有40W,还有爬虫程序:两个csv和一个db数据库,爬了几天了,在此分享给大家,可以做推荐系统使用,希望可以帮助到大家
1
123639条数据,已去重,包含.csv 和 .sql 两个数据文件 包含: 电影id 评分 参与评分的人数 电影名 初始电影名 电影别名 电影时长 指出年份 首播时间 电影海报url 电影语言 制片国家地区 编剧的人数 这部电影中编剧的id列表 电影主演人数 这部电影主演id列表 这部电影导演的人数 这部电影导演id列表 电影标签 电影类型 编剧列表 主演列表 导演列表
2021-08-11 18:58:56 24.24MB 豆瓣 电影 数据分析 .csv
1