Hadoop课程设计项目,使用idea编写基于MapReduce的学生成绩分析系统代码压缩包
2021-12-24 20:08:21 75KB mapreduce 课设 zip
1
Combiner 就相当于map后多reduce几次。 排序 如果想将mapreduce结果排序,需将排序对象作为键值。 案例:将利润求和后按照顺序排序 数据源 profit.txt 编号 | 姓名 | 收入 | 支出 1 ls 2850 100 2 ls 3566 200 3 ls 4555 323 1 zs 19000 2000 2 zs 28599 3900 3 zs 34567 5000 1 ww 355 10 2 ww 555 222 3 ww 667 192 步骤:先算利润再求和最后排序 求和: 自定义类 实现WritableComparable接口,除了实现序列化/反序列化,还
2021-12-24 16:34:15 96KB c ce do
1
完整全套资源下载地址:https://download.csdn.net/download/qq_27595745/61853691 【完整课程列表】 优质精品课程 北京大学云计算与应用教程 第0讲 序(共6页).pdf 优质精品课程 北京大学云计算与应用教程 第1讲 云计算概述(共73页).pdf 优质精品课程 北京大学云计算与应用教程 第2讲 云服务(共105页).pdf 优质精品课程 北京大学云计算与应用教程 第3讲 lab1:云服务体验(共54页).pdf 优质精品课程 北京大学云计算与应用教程 第4讲 虚拟化(共127页).pdf 优质精品课程 北京大学云计算与应用教程 第5讲 openstack(共97页).pdf 优质精品课程 北京大学云计算与应用教程 第6讲 分布式处理(共67页).pdf 优质精品课程 北京大学云计算与应用教程 第7讲 云存储(共79页).pdf 优质精品课程 北京大学云计算与应用教程 第8讲 MapReduce(共89页).pdf 优质精品课程 北京大学云计算与应用教程 第9讲 Hadoop(共121页).pdf 优质精品课程 北京大学云计算与应用教程 第10讲 云计算高级话题(共65页).pdf 优质精品课程 北京大学云计算与应用教程 第11讲 云计算业界动态与发展(共187页).pdf
2021-12-24 15:11:09 7.36MB 云计算 Hadoop openstack MapReduce
随着大数据时代的到来,K最近邻(KNN)算法较高的计算复杂度的弊端日益凸显。在深入研究了KNN算法的基础上,结合MapReduce编程模型,利用其开源实现Hadoop,提出了一种基于MapReduce和分布式缓存机制的KNN并行化方案。该方案只需要通过Mapper阶段就能完成分类任务,减少了TaskTracker与JobTracker之间的通信开销,同时也避免了Mapper的中间结果在集群任务节点之间的通信开销。通过在Hadoop集群上实验,验证了所提出的并行化KNN方案有着优良的加速比和扩展性。
2021-12-24 14:09:54 370KB KNN分类算法
1
云计算MapReduce实现KNN算法,使用环境:在vmware虚拟机上安装unbuntu14系统,系统中安装hadoop。文件中包含有MapReduce以及KNN的java代码、包含训练数据的excel表格以及详细的教程文档,文档中手把手教到如何使用代码和文件
2021-12-24 13:59:56 1.22MB 云计算 MapReduce KNN
1
分布式处理系统,适合集群式处理。提高运行效率以及容错率
2021-12-24 12:19:32 351KB MapReduce
1
什么样的计算任务可进行并行化计算? 并行计算的第一个重要问题是如何划分计算任务或者计算数据以便对划分的子任务或数据块同时进行计算。 但一些计算问题恰恰无法进行这样的划分! Nine women cannot have a baby in one month! 例如:Fibonacci函数: Fk+2 = Fk + Fk+1 前后数据项之间存在很强的依赖关系!只能串行计算! 结论:不可分拆的计算任务或相互间有依赖关系的数据无法进行并行计算!
2021-12-23 21:01:30 3.07MB MapReduce
1
针对物流配送路线优化,提出了将配送路线问题分解成若干可并行操作的子问题的云计算模式。详细论述了基于标色法的MapReduce广度优先算法并行化模型、节点数据结构、算法流程和伪代码程序,并通过将该算法应用于快递公司的实际配送,验证了该算法的可行性。
2021-12-23 08:41:46 247KB 物流配送
1
序列化/反序列化机制 当自定义一个类之后,如果想要产生的对象在hadoop中进行传输,那么需要 这个类实现Writable的接口进行序列化/反序列化 案例:统计每个人产生的总流量 数据源 自定义类序列化 import java.io.DataInput; import java.io.DataOutput; import java.io.IOException; import org.apache.hadoop.io.Writable; public class Flow implements Writable{ private String phone; private String
2021-12-22 13:36:04 39KB c ce do
1
对应博客:MapReduce 运行原理(万字长篇 原理 + 案例) 链接:https://blog.csdn.net/weixin_47243236/article/details/121581689?spm=1001.2014.3001.5501
2021-12-21 19:07:52 363KB MapReduce WordCount WebCount FileInputFormat
1