可作为java大数据课程设计使用: 详情查看:https://blog.csdn.net/weixin_46115961/article/details/126061076
1
mapreduce海量数据并行处理总结.pdf
2022-07-14 16:08:58 5.24MB 海量数据挖掘
Hadoop- 单词计数(Word Count)的MapReduce实现.doc
2022-07-13 13:07:28 673KB 技术资料
MongoDB的MapReduce.pdf 学习资料 复习资料 教学资源
2022-07-11 19:06:10 232KB 计算机
资源包含文件:课程论文报告word和PDF两个版本+源码及数据 本项目为一个Hadoop课程设计,使用Java语言和map/reduce实现贝叶斯文本分类器。项目的具体内容如下:1:用MapReduce算法实现贝叶斯分类器的训练过程,并输出训练模型; 2:用输出的模型对测试集文档进行分类测试。测试过程可基于单机Java程序,也可以是MapReduce程序。输出每个测试文档的分类结果; 3:利用测试文档的真实类别,计算分类模型的Precision,Recall和F1值。 详细介绍参考:https://blog.csdn.net/newlw/article/details/124984567
基于MapReduce并行化视频分析的研究与实现,易晓晔,詹志强,论文提出一种利用MapReduce编程模型加速视频处理过程的方法。随着大数据时代的到来,面对视频数据急速增长,此方法可以高效地处理海
2022-07-06 15:53:12 482KB 视频分析
1
选题:搜狗日志查询分析 (MapReduce+Hive综合实验) 前提条件: 安装好hadoop2.8.0 安装好HQL 安装好Hive 安装好eclipse 选题要求: 解压数据源,并上传到hdfs,保存的目录以个人学号区分,176为我的学号 创建hive表 编写MapReduce程序实现数据清洗,去掉不满足长度为6,并保证输出数据以 ','分割 将清洗后的数据导入Hive 使用SQL查询搜索结果排名第2点,点击次序排在第1的数据 实验步骤: 思路:用MapReduce做数据清洗,用Hive来分析数据。
2022-07-05 09:10:12 66.92MB hadoop hive mapreduce
1
基于mapreduce的小型电影推荐系统,使用javaweb的方式实现,包含数据集。
2022-07-02 19:08:28 46.68MB mapreduce javaweb 推荐系统
1
本文以在中移软件研发中心工作期间参与的大数据项目为背景,着重研究Hadoop相关系统的设计思想和基本框架,并设计和实现一个自动化、可扩展、可监控、可管理的应用于大规模Hadoop集群的部署管理系统,本文主要研究内容包含几个部分: 1.说明项目背景,分析项目的研究意义和应用前景。 2.研究Hadoop相关系统发展概况,说明现有的Hadoop集群部署管理技术,并对比分析它们的优缺点,为技术的选择和系统的设计提供依据。 3.深入分析Hadoop及其相关系统的设计思想和基本框架。重点研究 HDFS、MapReduce、HBase和Hive系统的核心算法和实现原理,分析它们运行的守护进程各自的职责和相互间协同工作模式,作为项目设计的理论基础。 4.深入研究项目所使用的技术。重点分析自动化配置和部署工具Puppet 的基本框架、运行机制和语法机制,为项目的设计和实现提供技术支持。 项目的分析、设计和实现。先对项目进行需求分析,分析大规模集群在硬件配置、操作系统、网络环境之间的异构性,分析Hadoop相关系统的服务、配置文件以及软件包之间的依赖关系。然后根据需求分析结果,对整个系统体系结构进行设计,
2022-06-28 14:06:08 2.87MB Hadoop 集群部署 MapReduce 部署管理系统
一个简单的MapReduce程序。Hadoop2.2.0上实测可用。
2022-06-26 19:58:50 13KB Hadoop2.2.0 MapReduce
1