使用python写微博关注者之间,相似度最高的十个用户的mapreduce,代码有点粗糙,主要是给大家提供思路的,不同的问题是需要修改的。
2022-06-16 13:59:51 1KB python mapreduce hadoop
1
MapReduce CSE587通过计算波动率来分析纳斯达克股票。 这是通过在Hadoop上使用MapReduce框架完成的。
2022-06-10 15:56:30 651KB Java
1
PageRank_MapReduce 在 Hadoop 上运行的 MapReduce 程序
2022-06-09 21:34:33 3KB Java
1
一个基于Hadoop平台进行的单词统计系统,其中包含了伪分布架构,并且包含HDFS数据存储,结合Java后台利用Mapreduce架包进行单词的统计与分析。包含了完整的实践过程,内涵源代码,以及实验命令,内容丰富,实验过程完整。指令明确,图文并茂,且配有对于每一个关键步骤的详细解释,对于新手及其友好。并且对于搭建过程中所会产生的问题,进行了详细的解释。内附Madreduce和程序整体的运行流程,过程清晰明了。
1
Linux运维-运维课程MP4频-06-大数据之Hadoop部署-13mapreduce是什么?.mp4
2022-06-06 14:00:44 23.69MB 运维 linux big data
Linux运维-运维课程MP4频-06-大数据之Hadoop部署-14mapreduce工作流程.mp4
2022-06-06 14:00:43 16.44MB 运维 linux big data
出租车预测 ## MapReduce程序使用首尔市提供的出租车分析数据预测出租车需求 ###开发环境操作系统:ubuntu-14.04.1(64bit) 工具:VMware Player,Eclipse平台(Maven项目) 处理器:单核处理器 记忆体:4GB ###目标使用首尔开放数据广场(data.seoul.go.kr)提供的首尔出租车运营分析数据,查找一周中特定时间出租车需求量最高的前10个地区的标准节点链接ID。 。 ###标准节点链接ID -什么是节点? 表示车辆在道路上行驶时发生速度变化的地方的地方 -什么是链接? 现实世界中的道路,指的是连接节点和节点的线,即发生速度变化的点。 -可以使用标准节点链接ID找到位置信息 相关链接: : ###参考 自己动手Hadoop编程/为Hangi /轻松发布欢呼 出租车运行分析应用指南.pdf ###数据集示例
2022-06-04 21:50:52 270KB Java
1
映射还原 好友推荐 描述 社交网站的一项常见功能是推荐人脉。 例如来自 Linkedin 的“你可能认识的人”。 基本思想是,如果A和B彼此不认识,但他们有共同的朋友,那么系统会将B推荐给A,反之亦然。 假设朋友是双向的。 如果 A 是 B 的朋友,那么 B 是 A 的朋友。在本实验中,我们将实现一个 MapReduce Java 程序来查找每对用户的共同朋友。 比如我们这里有五个用户:A、B、C、D、E。他们的好友列表存储为Person:[好友列表],像这样 A: BCDB: ACDEC: ABDED: ABCEE: BCD 所有用户对是 AB、AC、AD、AE、BC、BD、BE、CD、CE、DE。 AB 的共同朋友是 C 和 D。AC 的共同朋友是 B 和 D。实现这一点的方法不止一种。 一种方法解释如下。 输入的每一行都是映射器的一个参数。 例如,输入的第一行是“A:BCD”。
2022-06-04 21:45:56 4KB Java
1
概念 MapReduce是hadoop分布式计算框架。 MapReduce意味着在计算过程中实际分为两大步,Map过程和Reduce过程。 下面以一个统计单词次数简单案例为例: 数据源 Map类 import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; // 案例:统计每一个单词出现的次数 // KEYIN - 这一行的偏移量 --- // VALUEIN
2022-06-03 10:18:20 214KB c ce do
1
·MapReduce是一个用于处理海量数据的分布式计算框架。 ·这个框架解决了 ·数据分布式存储 ·作业调度 ·容错 ·机器间通信等复杂问题
2022-05-31 09:09:11 862KB big data mapreduce 源码软件