MapReduce设计模式.pdf
2022-05-19 12:02:53 42.51MB MR设计
1
hadoop并行计算mapreduce详解 很宝贵的大数据方向的学习资料。非常适合专注技术层次的人员学习。想要更多资源请关注。
2022-05-16 23:03:26 850KB hadoop 大数据 机器学习 集群
1
基于随机游走的社团发现算法Hadoop版 以及一个graph生成程序。整个是个eclipse项目,没有把lib放上来。内容在 http://blog.csdn.net/lgnlgn/article/details/6561876 的下一篇博客
2022-05-16 17:45:47 27KB label propagation mapreduce
1
MapReduce-KNN Hadoop MapReduce的K最近邻居实现 这是一个旨在与MapReduce框架一起使用的Java程序。 在此示例中,将K最近邻分类方法(有监督的机器学习)应用于有关汽车类型和购买者特征的一些样本数据,以便用可能的汽车模型对购买者进行分类。 用法: hadoop jar KnnPattern.jar KnnPattern /home/mhi/knn/CarOwners.csv / home / mhi / knn / res /home/mhi/knn/KnnParams.txt KnnPattern.jar –包含源代码的jar文件。 KnnPattern –程序中的顶级类,包含Mapper和Reducer类以及main()方法。 第一个参数:/home/mhi/knn/CarOwners.csv –数据输入文件在HDFS中的位置。 第二个
2022-05-16 15:32:28 22KB Java
1
Hadoop_MapReduce 使用Hadoop进行大数据处理 该项目在Hadoop框架上使用Map-Reduce从零开始实现基本的文本处理任务,例如字数,n元语法,倒排索引,关系连接和k近邻算法。
2022-05-16 15:26:00 8.21MB hadoop map-reduce hdfs inverted-index
1
完整的MapReduce程序代码 jar包 输入文件 以及输出结果
2022-05-16 10:53:36 19KB mapreduce SecondarySort jar
1
运行说明:在linux终端输入 $ hadoop jar test-1.0-SNAPSHOT.jar WordCount /input/* /MyOutput1/ 后两个参数是hdfs上面【输入】的文本文件目录和【输出】目录。 记得清空输出目录。
2022-05-15 10:45:42 6KB Hadoop
1
mapreduce的简单求平均数的例子,打成了jar包,可以直接在集群上运行
2022-05-14 19:06:14 4KB 求平均成绩
1
MapReduce求平均值示例程序,并且程序里利用了logger类,可以将调试信息输出到mapreduce的日志,可以根据输出信息了解运行机制
2022-05-14 15:14:44 139KB 平均值
1
针对当前一般档案信息数据库检索系统存在检索覆盖率低、检索延迟时间长的问题,设计一种基于MapReduce的档案信息数据库快速检索系统。研究设计分为四部分:搭建系统框架、选择系统硬件、设计MapReduce运算程序、系统应用分析。实验结果表明:利用基于MapReduce的系统进行档案信息数据库快速检索,平均检索覆盖率达到96.64%,平均检索延迟仅为12.36 s,这一结果要好于基于Lucene、B/S两种架构设计的一般档案信息数据库检索系统检索效果,由此可知本系统能在更短的时间内实现更为全面的档案信息搜索。
1