Bigdata-movie 本项目以电影数据为主题,以数据采集、处理、分析及数据可视化为项目流程,可实现百万级电影数据离线处理与计算。 项目详解:. 开发环境:IDEA+Pycharm+Python3+hadoop2.8+hive2.3.0+mysql5.7+sqoop+spark 1.数据采集(pachong.py)、预处理: 采集豆瓣电影top250电影信息,采集电影名称、电影简介、电影评分、其他信息、电影连接等字段,抓取电影票房总收入排名情况(取前20),删除冗余和空值字,利用Python的PyMysql库连接本地Mysql数据库并导入movies表,可以将数据保存到本地,从而进行数据可视化展示,也可将数据导入到大数据的Hive数仓工具中,用于大数据分析。 采集数据展示: 排序 影片名称 类型 总票房(万) 场均人次 上映日期 1 战狼2 动作 567928 38 2017/7/27
2022-11-05 15:29:48 7.13MB Python
1
ISO9000认证体系流程文档,做硬件嵌入式开发过程文档,包括,需求,计划,设计,测试,验收几大部分,每个部分都有参考文档。做开发必不可少的流程文档参考
1
项目流程规范示例ppt
2022-06-29 21:03:46 2.89MB 项目流程 项目管理
1
Fink源码分析, 收集不易 免费的,请关注点赞。 有能力的大爷请赏点
2022-06-25 19:08:21 11.16MB flink源码 flink源码分析 flink架构 flink
1
销售收入分析与预测 ( Pandas+ Matplotlib+ Scikit-learn实现)。 大数据时代,数据分析的本质是通过总结数据的规律解决商业问题,以帮助实际工作中的管理者做出决策和判断随着电商行业的激烈竞争,电商平台推出了各种数字营销方案,付费广告也是花样繁多。那么电商投入广告后究竟能给企业增加多少销售收入?对销售收入的影响究竟有多大?是否达到了企业的预期效果?针对这类问题企业将通过数据分析的方式来处理,而不是凭直觉妄加猜测。本章将通过具体的实例介绍如何通过科学的数据分析方法实现对销售收入的分析与预测。
2022-06-15 11:49:26 8.92MB Python项目源码 Python
大数据项目流程.rar
2022-05-19 15:23:25 164.71MB 大数据 项目流程
1
项目流程与需求分析视频
2022-05-19 14:04:52 14.2MB 需求分析
项目管理工程项目流程甘特图
2022-05-10 18:06:28 83KB 甘特图 综合资源 项目管理
1
该思维导图主要介绍项目流程从需求挖掘到驻场维护所需要的一系列流程
2022-04-20 14:54:46 32KB 项目流程
1
使用卫生保健数据预测抑郁 作者:Vivienne DiFrancesco 可以在找到用于探索该项目中使用的数据的配套仪表板 该存储库的内容是对使用机器学习模型来预测使用医疗保健数据的人的抑郁症的分析。 希望可以使工作更易于访问和复制,从而进行详细的分析。 储存库结构 README.md:此项目审阅者的顶级自述文件 first_notebook.ipynb:从数据清理阶段开始在jupyter笔记本中进行分析的叙述性文档 second_notebook.ipynb:在项目的探索阶段清理数据之后开始的叙述性文档的延续 PredictingDepressionSlides.pdf:项目演示幻灯片的PDF版本 project_functions文件夹:包含编写用于first_notebook和second_notebook的自定义函数 仪表板文件夹:包含用于创建此项目的配套仪表板的文件的文件夹 抽
2022-04-11 19:56:07 71.88MB data-science python3 healthcare machinelearning
1