本系统主要设计完成两件工作,一是搭建分布式的hadoop的集群环境,二是基于分布式的集群环境做日志分析。详细介绍参考:https://blog.csdn.net/newlw/article/details/127332767
2022-11-30 14:25:46 1.25MB hadoop hive 数据处理 电影数据分析
安装环境配置,使用案例等
2022-11-24 16:22:45 577KB 大数据 hadoop hive
1
适合自学大数据,文档详细,涉及到Oracle数据库SQL plsql. Linux系统常用命令 大数据:hadoop hive shell脚本 大数据搬运工具:sqoop ,ketlle. 调度工具:azkaban, 可视化软件使用:帆软 数据仓库设计理论,数仓建模,三范式等;
2022-08-28 09:03:43 10.11MB 数据库 Oracle Hadoop Linux
1
包含虚拟机的安装步骤,centos系统安装,网络配置,环境配置,集群配置,详细命令,图文详解。
2022-07-13 18:10:37 5.82MB hadoop hive 虚拟机
1
选题:搜狗日志查询分析 (MapReduce+Hive综合实验) 前提条件: 安装好hadoop2.8.0 安装好HQL 安装好Hive 安装好eclipse 选题要求: 解压数据源,并上传到hdfs,保存的目录以个人学号区分,176为我的学号 创建hive表 编写MapReduce程序实现数据清洗,去掉不满足长度为6,并保证输出数据以 ','分割 将清洗后的数据导入Hive 使用SQL查询搜索结果排名第2点,点击次序排在第1的数据 实验步骤: 思路:用MapReduce做数据清洗,用Hive来分析数据。
2022-07-05 09:10:12 66.92MB hadoop hive mapreduce
1
apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle
2022-06-17 22:05:55 581.01MB hive spark zk
1
apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle
2022-06-17 22:05:54 502.74MB hadoop
1
apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle
2022-06-17 19:04:43 751.65MB myslq8
1
apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz
2022-06-15 21:05:10 623.38MB 大数据
1
apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz
2022-06-15 21:05:09 599.82MB 大数据
1