搜索【hadoop 】的结果

HadoopEclipsePlugin273.zip

2022-12-12 09:24:52 32.96MB Hadoop

1

hadoop-2.7.1.rar

2022-12-12 09:24:51 951KB Hadoop

1

winutils.exe 资源包

winutils.exe是hadoop的执行文件之一，但有时我们下载的hadoop编译后的文件可能会出现一些丢失，这正是其中的资源之一

2022-12-12 09:24:51 40KB hadoop winutils.exe

1

Hadoop实践项目test7.py

Hadoop实践项目test7.py 课本上的例题中的一个python文件完整版下载传到虚拟机运行即可得到数据或图表

2022-12-12 09:24:50 3KB Hadoop Hadoop示例 test7.py文件 实战项目

1

数据仓库Hive伪分布式部署与应用(1).docx

数据仓库Hive伪分布式部署与应用

2022-12-10 14:23:20 1.83MB hive Hadoop 数据仓库

1

（Hive编程应用2）.docx

数据仓库Hive伪分布式部署与应用

2022-12-10 14:23:19 1.11MB Hadoop hive编程 hive

1

基于Hadoop的全国酒店数据清洗项目源码+报告.zip

基于Hadoop的全国酒店数据清洗项目源码+报告.zip结合本案例背景介绍，说明对本数据集进行分析的目的，说明采用的分析技术，实现的价值。本案采用的数据集是全国各省市酒店的运营情况数据集，对该数据集进行分析的目的是为了更好的指导酒店行业的发展。本案例使用hdfs分布式存储系统存储数据，利用Hadoop的MapReduce技术进行数据分析。 3、简要介绍mapreduce框架 MapReduce是面向大数据并行处理的计算模型、框架和平台，它隐含了以下三层含义：（1）MapReduce是一个基于集群的高性能并行计算平台（Cluster Infrastructure）。它允许用市场上普通的商用服务器构成一个包含数十、数百至数千个节点的分布和并行计算集群。基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip

2022-12-10 14:23:19 990KB 基于Hadoop全国酒店数据清洗 全国酒店数据清洗项目 Hadoop

牛客网招聘网站数据集爬取

牛客网招聘网站数据集爬取，用于大数据基础课程设计项目的统计分析。主要是利用招聘数据在Hadoop生态中进行导入、导出、统计分析、数据可视化。

2022-12-09 14:24:52 2.43MB Hadoop 牛客网招聘数据 大数据

1

Hadoop 分布式部署配置及基准性能测试

Hadoop V3.3.3 分布式部署步骤，DFSIO和Tersort基准测试

2022-12-08 19:18:06 905KB 数据库 测试环境

1

matlab聚类kmeans代码-hadoop-hw7:hadoop-hw7

matlab聚类kmeans代码作业7 要求在MapReduce上实现K-Means算法并在小数据集上测试。可以使用附件的数据集，也可以随机生成若干散点的二维数据（x, y)。设置不同的K值和迭代次数，可视化聚类结果。提交要求同作业5，附上可视化截图。实现思路我直接使用了实例代码来运行，用原来的代码创建maven项目KMeansExample。由于原来的代码不是用maven管理的，而且是基于Hadoop1.2编写的程序，所以有一些地方需要进行小小的修改。比如每个java文件前面都要加上对应的包名称，Job对象的创建需要调用getInstance静态方法，而不能直接new Job。我尝试研读了整个算法的代码，下面简要描述一下示例代码的思路。主程序：KMeansDriver.main() KMeansDriver.main()方法是整个算法的主程序，它从命令行接收指定的参数k（需要聚成的类数），iterationNum（迭代次数），inputpath，outputpath。依次调用三个主要的过程： generateInitialCluster()：随机产生k个cluster

2022-12-07 18:05:50 1.23MB 系统开源

1

个人信息

热门下载

最新下载

其他资源