该项目是大三下学期的课程设计,使用的数据集来自知名数据网站 Kaggle 的 tmdb-movie-metadata 电影数据集,以Python为编程语言,使用大数据框架Spark对数据进行了预处理,然后分别从多个方面对数据进行了分类和分析,并对分析结果进行可视化。里面包含我的课程设计报告和完整的代码。希望对你们有帮助。
2022-06-24 19:07:37 3.43MB python big data spark
Hadoop电影数据集,包含字段说明
2022-06-17 18:04:51 28KB hadoop 豆瓣
豆瓣用户每天都在对“看过”的电影进行“很差”到“力荐”的评价,豆瓣根据每部影片看过的人数以及该影片所得的评价等综合数据,通过算法分析产生豆瓣电影 Top 250。 为了分析电影产业的发展趋势,本次实验需要对这些信息做统计分析。 注意:豆瓣网站的数据形式为文本文件(必须将导入到hive中做处理)。也可以为CSV文件,例如下图: 针对本次实验,我们需要用到Hadoop集群作为模拟大数据的分析软件,集群环境必须要包括,hdfs,hbase,hive,flume,sqoop等插件,最后结合分析出来的数据进行可视化展示,需要用到Python(爬取数据集,可视化展示)或者echarts等可视化工具。
Hadoop豆瓣电影数据分析(Hadoop)操作源码
2022-06-17 09:10:52 7KB Hadoop
聊天机器人 具有使用康奈尔电影数据集的Transformer Architecture的聊天机器人。 要使用经过训练的模型,请从发布页面下载模型权重。 将权重文件移动到models目录并运行chat.py
2022-06-14 17:54:01 1.89MB Python
1
对豆瓣电影经行数据化分析,利用python对豆瓣电影评分经行可视化分析得出排名
2022-06-12 21:56:14 148KB 电影数据分析
1
1、资源内容:毕业设计lun-wen word版10000字+;开题报告,任务书 2、学习目标:快速完成相关题目设计; 3、应用场景:课程设计、diy、毕业、参赛; 4、特点:直接可以编辑使用; 5、使用人群:设计参赛人员,学生,教师等。 6、使用说明:下载解压可直接使用。 7、能学到什么:通过学习本课题的设计与实现, 了解不同课题的知识内容,学习内部架构和原理,掌握有关课题重要资源, 同时增加自己对不同方面知识的了解,为后续的创作提供一定的设计思路和设计启发 , 并且可以快速完成相关题目设计,节约大量时间精力,也为后续的课题创作 提供有力的理论依据、实验依据和设计依据,例如提供一些开源代码、设计原理、 原理图、电路图、毕业设计lun-wen word版10000字+;开题报告,任务书等有效的资料, 也可以应用于课程设计、diy、毕业、参赛等不同场景,而且本设计简单,通俗易通, 方便快捷,易于学习,下载之后可以直接可以编辑使用, 可以为设计参赛人员、学生、老师及爱好者等不同使用者提供有效且实用的学习资料 及参考资料,同时也是一份值得学习和参考的资料。
2022-06-06 14:06:15 1.87MB python 数据分析 综合资源 开发语言
展示了电影的id,title,director,year
2022-05-27 11:46:23 11KB tablet
1
人工智能-项目实践-SVR回归-基于猫眼电影数据和SVR回归器的电影票房预测系统
电影可视化 电影数据集的 D3 可视化。 请参阅: : 以实时查看可视化。
2022-05-21 00:38:43 78KB JavaScript
1