flume1.9,hive2.3.4,hbase1.4.10,jdk等
2022-05-12 18:11:22 689.23MB hadoop 大数据 big data
1
基于Hadoop部署实践对网站日志分析 1. 项目概述 本次要实践的数据日志来源于国内某技术学习论坛,该论坛由某培训机构主办,汇聚了众多技术学习者,每天都有人发帖、回帖。至此,我们通过Python网络爬虫手段进行数据抓取,将我们网站数据(2013-05-30,2013-05-31)保存为两个日志文件,由于文件大小超出我们一般的分析工具处理的范围,故借助Hadoop来完成本次的实践。 2. 总体设计 2.1 Hadoop插件安装及部署 第一步:Hadoop环境部署和源数据准备 安装好VMware(查看) 第二步:使用python开发的mapper reducer进行数据处理。 第三步:创建hive数据库,将处理的数据导入hive数据库 第四步:将分析数据导入mysql 3. 详细实现步骤操作纪要 3.1 hadoop环境准备 首先开启Hadoop集群:start-all.sh:开启所有的Hadoop所有进程,在主节点上进行 NameNode它是Hadoop 中的主服务器,管理文件系统名称空间和对集群中存储的文件的访问。 Secondary NameNode.....
2022-05-09 19:13:59 1.89MB 文档资料 hadoop 大数据 分布式
elasticsearch-hadoop
2022-05-08 14:06:42 9.6MB elasticsearch hadoop 大数据 big
1
Spring 加密工具包,kylin密码加密工具包,亲测可用, 通过java -jar encryption.jar admin运行
2022-05-07 13:36:12 9.42MB Hadoop 大数据 spring加密工具
1
hadoop 3.3.2源码包
2022-05-06 18:12:35 33.19MB 源码软件 hadoop 大数据 big
1
(1)统计全球每年的最高气温和最低气温。 (2)MapReduce输出结果包含年份、最高气温、最低气温,并按最高气温降序排序。如果最高气温相同,则按最低气温升序排序。 (3)使用自定义数据类型。 (4)结合Combiner和自定义数据类型完成全球每年最高气温和最低气温的统计。 (5)应用ToolRunner的使用和Eclipse提交MapReduce任务。
2022-05-04 14:08:15 74KB big data hadoop 大数据
1
Hadoop的环境搭建所需版本
2022-05-04 14:08:14 194.56MB hadoop 大数据 big data
1
(1)统计全球每年的最高气温和最低气温。 (2)MapReduce输出结果包含年份、最高气温、最低气温,并按最高气温降序排序。如果最高气温相同,则按最低气温升序排序。 (3)使用自定义数据类型。 (4)结合Combiner和自定义数据类型完成全球每年最高气温和最低气温的统计。 (5)应用ToolRunner的使用和Eclipse提交MapReduce任务。
2022-05-04 14:08:12 895KB hadoop 大数据 big data
1
Hadoop分布式大数据系统.
2022-05-02 19:06:38 1.03MB 分布式 hadoop 大数据 big
依赖包
2022-04-22 19:06:10 61KB hadoop 大数据 big data
1