电影数据分析
刘家硕计63 2016011286
一,实验概述
1.实验目标
本项目希望基于电影数据集,依据电影的简介,关键字,预算,票房,用户评分等特征来对电影进行分析,并完成以下任务:
对电影特征的可视化分析
对电影票房的预测
多功能个性化的电影推荐算法
2.数据集
针对票房预测部分,本项目使用了收集数据集的7398条电影信息,包含了id,预算,电影主页,票房,语言,时长,评分,受欢迎度等特征,全部数据可见于中。
针对电影推荐部分,本项目使用了收集数据集的TMDB5000数据集以及收集自电影数据集的部分数据,包含了id,预算,内容简介,关键字等特征,并且包含了用户对电影的评分矩阵,全部数据可见于中。
3.实验完成情况
完成了对电影特征的可视化分析。
完成了基于电影特征的电影票房预测算法,并在Kaggle的TMDB票房预测比赛中最终取得了前6.8%(95/1400)的成绩。
完成了基于简
2021-08-30 13:53:48
30.94MB
系统开源
1