基于搜狗查询数据500w条使用MapReduce做数据清洗,hive做离线分析的项目,详细文档附数据连接,搜狗实验室的搜索数据下载后缺少了用户ID字段的数据,所以本分析采用的是完整的数据,大家可以放心下载,如果下载数据的百度云链接失效无法下载,大家可以给我留言。
2020-01-04 03:14:55 3.28MB hive hadoop MapReduce 大数据离线分析项目
1
java操作hadoop之mapreduce分析年气象数据最低温度实战源码,附带所需jar包,欢迎学习。
2020-01-03 11:30:00 35.64MB hadoop实战
1
在hadoop平台上,用mapreduce编程实现大数据的词频统计
2020-01-03 11:28:40 5KB 大数据 hadoop mapreduce
1
该文件是用于MapReduce分析年气象数据用源代码打成的jar包,虽然名字为MaxTemperature,但里面也包含了MinTemperature的程序。所以可以求取每年的最大值和最小值。
2020-01-03 11:20:56 16.11MB MapReduce MaxTemperatu MinTemperatu
1
java项目 基于Hadoop对网站日志数据分析 使用MapReduce框架进行分析,并包含150M的网站日志数据
2019-12-21 22:26:27 81.98MB java Hadoop 日志数据 MapReduce
1
基于Mapreduce的朴素贝叶斯分类
2019-12-21 22:21:33 21KB 贝叶斯 Mapreduce Hadoop
1
本文件用于初学者学习hadoop权威指南时编写的获取最大气温的气象数据集,本人已测试使用
2019-12-21 22:09:25 4.27MB hadoop 气象数据
1
参考网络资源使用IKAnalyzer分词组件,实现了纯Java语言、MapReduce模式及Spark 框架三种方式对唐诗宋词等国学经典进行中文分词统计排序的功能,你可以轻松发现唐诗宋词中最常用的词是那几个。
2019-12-21 22:08:28 379KB Spark Java MapReduce IKAnalyzer
1
Hadoop是一个主要由Java语言开发的项目,基于Hadoop的MapReduce程序也主要是使用Java语言来编写。但是有一些时候,我们需要在MapReduce程序中使用C语言、C++以及其他的语言,比如项目的开发人员更熟悉Java之外的语言,或者项目已经有部分功能用其他语言实现等。针对这些情况,我们需要研究如何在基于Java的MapReduce程序中引入其他语言。经过调研,在MapReduce任务中使用C++程序的方法主要有三种:Hadoop Streaming、Hadoop Pipes以及Hadoop JNI。
2019-12-21 22:06:39 418KB Hadoop MapReduce C语言 数据挖掘
1
mapreduce
2019-12-21 22:02:42 60KB mapreduce
1