基于随机游走的社团发现算法Hadoop版 以及一个graph生成程序。整个是个eclipse项目,没有把lib放上来。内容在 http://blog.csdn.net/lgnlgn/article/details/6561876 的下一篇博客
2022-05-16 17:45:47 27KB label propagation mapreduce
1
MapReduce-KNN Hadoop MapReduce的K最近邻居实现 这是一个旨在与MapReduce框架一起使用的Java程序。 在此示例中,将K最近邻分类方法(有监督的机器学习)应用于有关汽车类型和购买者特征的一些样本数据,以便用可能的汽车模型对购买者进行分类。 用法: hadoop jar KnnPattern.jar KnnPattern /home/mhi/knn/CarOwners.csv / home / mhi / knn / res /home/mhi/knn/KnnParams.txt KnnPattern.jar –包含源代码的jar文件。 KnnPattern –程序中的顶级类,包含Mapper和Reducer类以及main()方法。 第一个参数:/home/mhi/knn/CarOwners.csv –数据输入文件在HDFS中的位置。 第二个
2022-05-16 15:32:28 22KB Java
1
Hadoop_MapReduce 使用Hadoop进行大数据处理 该项目在Hadoop框架上使用Map-Reduce从零开始实现基本的文本处理任务,例如字数,n元语法,倒排索引,关系连接和k近邻算法。
2022-05-16 15:26:00 8.21MB hadoop map-reduce hdfs inverted-index
1
完整的MapReduce程序代码 jar包 输入文件 以及输出结果
2022-05-16 10:53:36 19KB mapreduce SecondarySort jar
1
运行说明:在linux终端输入 $ hadoop jar test-1.0-SNAPSHOT.jar WordCount /input/* /MyOutput1/ 后两个参数是hdfs上面【输入】的文本文件目录和【输出】目录。 记得清空输出目录。
2022-05-15 10:45:42 6KB Hadoop
1
mapreduce的简单求平均数的例子,打成了jar包,可以直接在集群上运行
2022-05-14 19:06:14 4KB 求平均成绩
1
MapReduce求平均值示例程序,并且程序里利用了logger类,可以将调试信息输出到mapreduce的日志,可以根据输出信息了解运行机制
2022-05-14 15:14:44 139KB 平均值
1
针对当前一般档案信息数据库检索系统存在检索覆盖率低、检索延迟时间长的问题,设计一种基于MapReduce的档案信息数据库快速检索系统。研究设计分为四部分:搭建系统框架、选择系统硬件、设计MapReduce运算程序、系统应用分析。实验结果表明:利用基于MapReduce的系统进行档案信息数据库快速检索,平均检索覆盖率达到96.64%,平均检索延迟仅为12.36 s,这一结果要好于基于Lucene、B/S两种架构设计的一般档案信息数据库检索系统检索效果,由此可知本系统能在更短的时间内实现更为全面的档案信息搜索。
1
本代码使用mapreduce实现,包含mr操作文件,操作hive,hbase,关系型数据库等等。
2022-05-11 15:34:56 253KB mr mapreduce hadoop
1
MapReduce中文版
2022-05-11 11:00:51 788KB mapreduce 综合资源 big data
1