hadoop-2.7.1.rar
2022-12-12 09:24:51 951KB Hadoop
1
winutils.exe是hadoop的执行文件之一,但有时我们下载的hadoop编译后的文件可能会出现一些丢失,这正是其中的资源之一
2022-12-12 09:24:51 40KB hadoop winutils.exe
1
Hadoop实践项目test7.py 课本上的例题中的一个python文件 完整版 下载传到虚拟机运行即可得到数据或图表
1
数据仓库Hive伪分布式部署与应用
2022-12-10 14:23:20 1.83MB hive Hadoop 数据仓库
1
数据仓库Hive伪分布式部署与应用
2022-12-10 14:23:19 1.11MB Hadoop hive编程 hive
1
基于Hadoop的全国酒店数据清洗项目源码+报告.zip结合本案例背景介绍,说明对本数据集进行分析的目的,说明采用的分析技术,实现的价值。 本案采用的数据集是全国各省市酒店的运营情况数据集,对该数据集进行分析的目的是为了更好的指导酒店行业的发展。本案例使用hdfs分布式存储系统存储数据,利用Hadoop的MapReduce技术进行数据分析。 3、简要介绍mapreduce框架 MapReduce是面向大数据并行处理的计算模型、框架和平台,它隐含了以下三层含义: (1)MapReduce是一个基于集群的高性能并行计算平台(Cluster Infrastructure)。它允许用市场上普通的商用服务器构成一个包含数十、数百至数千个节点的分布和并行计算集群。 基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip
牛客网招聘网站数据集爬取,用于大数据基础课程设计项目的统计分析。主要是利用招聘数据在Hadoop生态中进行导入、导出、统计分析、数据可视化。
2022-12-09 14:24:52 2.43MB Hadoop 牛客网招聘数据 大数据
1
Hadoop V3.3.3 分布式部署步骤,DFSIO和Tersort基准测试
2022-12-08 19:18:06 905KB 数据库 测试环境
1
matlab聚类kmeans代码 作业7 要求 在MapReduce上实现K-Means算法并在小数据集上测试。可以使用附件的数据集,也可以随机生成若干散点的二维数据(x, y)。设置不同的K值和迭代次数,可视化聚类结果。 提交要求同作业5,附上可视化截图。 实现思路 我直接使用了实例代码来运行,用原来的代码创建maven项目KMeansExample。由于原来的代码不是用maven管理的,而且是基于Hadoop1.2编写的程序,所以有一些地方需要进行小小的修改。比如每个java文件前面都要加上对应的包名称,Job对象的创建需要调用getInstance静态方法,而不能直接new Job。 我尝试研读了整个算法的代码,下面简要描述一下示例代码的思路。 主程序:KMeansDriver.main() KMeansDriver.main()方法是整个算法的主程序,它从命令行接收指定的参数k(需要聚成的类数),iterationNum(迭代次数),inputpath,outputpath。依次调用三个主要的过程: generateInitialCluster():随机产生k个cluster
2022-12-07 18:05:50 1.23MB 系统开源
1
自己找的,超好用CSV切割器,工具挺好的,如有侵权联系作者处理,大文件切割,下载解压后打开Data.olllo.exe脚本,选择内核 P内核
2022-12-06 16:11:04 59.8MB hadoop csv 大数据 数据分析
1