搜索【Hadoop的】的结果

本次要实践的数据日志来源于国内某技术学习论坛，该论坛由某培训机构主办，汇聚了众多技术学习者，每天都有人发帖、回帖。至此，我们通过Python网络爬虫手段进行数据抓取，将我们网站数据（2013-05-30,2013-05-31）保存为两个日志文件，由于文件大小超出我们一般的分析工具处理的范围，故借助Hadoop来完成本次的实践。使用python对原始数据进行清洗，以便后续进行统计分析；使用Hive对清洗后的数据进行统计分析；使用Sqoop把Hive产生的统计结果导出到mysql中；两个日志文件，一共有200MB，符合大数据量级，可以作为推荐系统数据集和hadoop测试集。

2022-05-09 19:14:04 13.7MB 数据分析 hadoop 文档资料 python

hadoop实训课数据清洗py脚本（MapReduce python代码，可执行文件脚本，使用方法）

可以作为大数据预处理的MapReduce代码的参考！！！ -执行脚本文件： cd /home/hadoop/logfiles/ source format_run_2013_o5_30.sh source format_run_2013_o5_31.sh 执行我们的脚本文件，可以用source或者./

2022-05-09 19:14:03 55KB python hadoop mapreduce 开发语言

使用hadoop-streaming运行Python编写的MapReduce程序.rar

2022-05-09 19:14:02 511KB 源码软件 hadoop python mapreduce

hive安装资料手册.rar

2022-05-09 19:14:01 5.03MB hive 源码软件 hadoop 数据仓库

hadoop实践项目-PPT演示步骤

实践的数据日志来源于国内某技术学习论坛，该论坛由某培训机构主办，汇聚了众多技术学习者，每天都有人发帖、回帖。至此，我们通过Python网络手段进行数据抓取，将我们网站数据（2013-05-30,2013-05-31）保存为两个日志文件，由于文件大小超出我们一般的分析工具处理的范围，故借助Hadoop来完成本次的实践。

2022-05-09 19:14:01 2.01MB hadoop 文档资料 python 大数据

Hadoop部署实践所需的安装包（Ubuntu下的安装包）

1、apache-hive-2.3.5-bin.tar.gz 2、hadoop-2.7.3.tar.gz 3、jdk-8u162-linux-x64.tar.gz 4、mysql-connector-java-5.1.24.tar.gz 5、sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz

2022-05-09 19:14:00 623.33MB ubuntu hadoop 文档资料 linux

Hadoop网站日志分析源码（hive命令）.txt

2022-05-09 19:14:00 2KB hive hadoop 源码软件 数据仓库

基于hadoop对某网站日志分析部署实践课程设计报告参考模板.doc

基于Hadoop部署实践对网站日志分析 1. 项目概述本次要实践的数据日志来源于国内某技术学习论坛，该论坛由某培训机构主办，汇聚了众多技术学习者，每天都有人发帖、回帖。至此，我们通过Python网络爬虫手段进行数据抓取，将我们网站数据（2013-05-30,2013-05-31）保存为两个日志文件，由于文件大小超出我们一般的分析工具处理的范围，故借助Hadoop来完成本次的实践。 2. 总体设计 2.1 Hadoop插件安装及部署第一步：Hadoop环境部署和源数据准备安装好VMware（查看）第二步：使用python开发的mapper reducer进行数据处理。第三步：创建hive数据库，将处理的数据导入hive数据库第四步：将分析数据导入mysql 3. 详细实现步骤操作纪要 3.1 hadoop环境准备首先开启Hadoop集群：start-all.sh：开启所有的Hadoop所有进程，在主节点上进行 NameNode它是Hadoop 中的主服务器，管理文件系统名称空间和对集群中存储的文件的访问。 Secondary NameNode.....

2022-05-09 19:13:59 1.89MB 文档资料 hadoop 大数据 分布式

spark-2.4.7-bin-without-hadoop

spark-2.4.7-bin-without-hadoop 记得先解压

2022-05-08 20:00:36 160.56MB spark hadoop 综合资源 大数据

1

大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK......

大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK...... 大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK...... 大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK...... 大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK...... 大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK...... 大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK...... 大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK...... 大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK...... 大数据笔记，包含Hadoop、Spark、Flink、Hive、Kafka、Flume、ZK...... 大数据笔记，包含Hadoop

2022-05-08 19:06:34 80.08MB hive big data hadoop

个人信息

热门下载

最新下载

其他资源