TMDB电影数据分析,包括Kaggle上的原始数据集,以及代码,实现电影类型和票房,利润等的关系,对比两个公司的电影类型收入,拍摄集中年份,画出饼图,条形图,折线图,并进行关键词的提取,做出词云图。
2021-12-23 23:40:22 6.03MB Kaggle
1
数据来源:https://www.kaggle.com/damianpanek/sunday-eda/data 数据描述:2006年到2016年1000部最流行的电影数据 报告分为: (1)提出问题 (2)认识数据 (3)清洗数据 (4)分析数据 (5)总结 (一)提出问题 (1)获取评分的平均分信息 (2)分析导演信息 (3)获取演员人数信息 (4)查看电影时长(runtime)的分布情况 (5)对电影上映时间进行分析 (6)统计电影分类(genre)的情况 (7)分析电影票房与哪些因素相关** (二)认识数据 1、首先导入相关的python数据分析的库 import pandas as p
2021-12-14 15:50:20 38KB 数据 数据分析 电影
1
最新Pyhton电影数据分析、python电影数据可视化。项目内容所涉及组件Pandas、matplotlib、numpy等。采用python3.7及以上开发环境。
1
完整版基于R语言的数据挖掘数据分析实操案例 2000到2015年豆瓣共47000部电影数据分析 从数据抓取到数据分析全流程案例
2021-10-01 09:04:47 2.49MB
123639条数据,已去重,包含.csv 和 .sql 两个数据文件 包含: 电影id 评分 参与评分的人数 电影名 初始电影名 电影别名 电影时长 指出年份 首播时间 电影海报url 电影语言 制片国家地区 编剧的人数 这部电影中编剧的id列表 电影主演人数 这部电影主演id列表 这部电影导演的人数 这部电影导演id列表 电影标签 电影类型 编剧列表 主演列表 导演列表
2021-08-11 18:58:56 24.24MB 豆瓣 电影 数据分析 .csv
1
【基于R语言的数据挖掘数据分析实操案例】 【2000到2015年豆瓣共47000部电影数据分析】 第一章 数据抓取 第二章 整理电影属性 第三章 整理电影属性 第四章 这样的图表才专业 第五章 频率密度图学会ggplot2 配件 第六章大数据:谁是演艺圈的“关系户“ 第七章 社交网络数据挖掘
tmdb数据电影分析与预测
2021-07-19 15:07:43 9.05MB 数据分析
1
先爬虫得到电影目录和票房,在建模进行预测电影票房
2021-07-12 15:07:47 4.29MB 爬虫 数据分析
1
在这个豆瓣电影分析与推荐系统中,我们使用了PYTHON语言来编写整个项目代码,分析所需数据完全利用爬虫爬取得到,爬取所得的数据被存入MYSQL数据库中,取得的数据被用作两个方面。 其一,被爬取得到的数据被用于进行电影分析,我们将爬取到的top300部电影的信息按照影片发行国家和影片类型进行了分析并制作了图表来直观显示受欢迎的电影的分类。 其二,我们利用了一种用于推荐系统的算法---协同过滤算法,来为每位参与电影评分的用户筛选出推荐电影内容,首先读入数据,形成用户-电影矩阵,其次根据用户-电影矩阵计算不同电影之间的相关系数(一般用person相关系数),形成电影-电影相关度矩阵。然后根据电影-电影相关度矩阵,以及用户已有的评分,通过加权平均计算用户未评分电影的预估评分。例如用户对A电影评3分、B电影评4分、C电影未评分,而C电影与A电影、B电影的相关度分别为0.3和0.8,则C电影的预估评分为(0.3*3+0.8*4)/(0.3+0.8)。 然后,我们实现了一些创新的功能。首先,我们爬取网页当中电影的数据,对网页当中的电影数据进行分析,分类,确定不同类型电影的百分比。然后我们分析用户对不同类型电影的打分情况,运用同类分析的方法对用户进行推荐其可能感兴趣的电影
2021-06-26 13:08:49 591KB 豆瓣电影 数据分析 推荐系统
数据来源于豆瓣、艺恩网站电影数据。其数据有数据分析的意义与价值。
2021-05-25 12:02:47 2.27MB 数据分析 可视化
1