本系统主要设计完成两件工作,一是搭建分布式的hadoop的集群环境,二是基于分布式的集群环境做日志分析。详细介绍参考:https://blog.csdn.net/newlw/article/details/127332767
2022-11-30 14:25:46 1.25MB hadoop hive 数据处理 电影数据分析
大数据Hadoop第八章hive
2022-11-28 21:22:17 7.07MB 大数据
1
datagrip连hive连不上,用这个驱动可以连上
2022-11-24 19:26:01 15.79MB hive DataGrip
1
安装环境配置,使用案例等
2022-11-24 16:22:45 577KB 大数据 hadoop hive
1
Hive编程指南_PDF_中文高清版.pdf
2022-11-22 17:01:54 26.8MB Hive编程指南 PDF 中文高清版
1
pdf文件讲述hive实现原理,图文并茂。
2022-11-21 20:58:30 3.21MB hive hadoop hbase mapreduce
1
hive-mysqlhive-mysql
2022-11-21 18:25:45 581.83MB hive
1
HiveJDBC41.jar
2022-11-21 18:25:44 14.87MB hive clouder
1
hive编程指南完整版,带书签,适合hive初入用户快速了解hive的安装,原理,和调优等操作,用作个人学习,不要用来商业用途
2022-11-08 09:23:54 26.29MB hive
1
Bigdata-movie 本项目以电影数据为主题,以数据采集、处理、分析及数据可视化为项目流程,可实现百万级电影数据离线处理与计算。 项目详解:. 开发环境:IDEA+Pycharm+Python3+hadoop2.8+hive2.3.0+mysql5.7+sqoop+spark 1.数据采集(pachong.py)、预处理: 采集豆瓣电影top250电影信息,采集电影名称、电影简介、电影评分、其他信息、电影连接等字段,抓取电影票房总收入排名情况(取前20),删除冗余和空值字,利用Python的PyMysql库连接本地Mysql数据库并导入movies表,可以将数据保存到本地,从而进行数据可视化展示,也可将数据导入到大数据的Hive数仓工具中,用于大数据分析。 采集数据展示: 排序 影片名称 类型 总票房(万) 场均人次 上映日期 1 战狼2 动作 567928 38 2017/7/27
2022-11-05 15:29:48 7.13MB Python
1