MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。 当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。
2021-08-03 09:44:31 1.78MB 大数据
Community Detection inOnline Social Networks大数据大中小数据集所对应的mapreduce代码
2021-07-17 22:49:46 782B 大数据 mapreduce 社交网
1
thetaJoin 使用 Map-Reduce 编程框架实现 theta 连接的算法
2021-06-27 11:04:00 2KB Java
1
#MPI和Map-Reduce在KMeans聚类算法上的应用 2 种不同 K-Means 实现在性能和开发工作方面的比较 - 基于 MapReduce 和 MPI。 ##问题描述 参考Assignment3.pdf ##报告 参考 A3-Report.pdf ##为 KMeans 运行 MPI 参考 Run-Kmeans-MPI.txt ##Run MapReduce for KMeans 参考 Run-Kmeans-Hadoop.txt
2021-06-08 18:05:21 583KB C
1
基于hadoop平台的k-means算法使用map-reduce模式
2021-05-16 21:08:25 57KB kmeans hadoop map-reduce
1
包含两种平台上运行的kmeans算法:一种是在Hadoop系统上的并行化kmeans算法,支持读文件,执行聚类算法,输出质心文件,将每个数据的聚类信息输出到控制台上;另一种是串行的聚类算法,支持读文件数据,执行kmeans算法,将每个数据的聚类信息输出到文件中。代码注释清晰。
2019-12-21 20:48:06 5KB kmeans hadoop java map/reduce
1
自己的第一个hadoop 实例,好高兴分享一下。 运行命令hadoop jar ‘/home/hadoop/downloas/max.jar’ upload.MaxTemperature
2019-12-21 19:49:39 11KB hadoop map reduce
1