hadoop-3.0.0里面的bin文件夹 解压覆盖即用,内含hadoop.dll和winutils.exe文件 记得将两个文件复制到C:\windows\System32目录下
2022-09-12 14:05:27 956KB hadoop mapreduce centos hdfs
1
大数据 基于mapreduce
2022-08-31 20:00:37 114KB 大数据
1
倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index)。带有倒排索引的文件我们称为倒排索引文件,简称倒排文件(inverted file)。
2022-08-31 15:59:25 6KB 倒排索引
1
基于Hadoop和MapReduce的商品推荐.pdf
2022-08-29 09:04:59 1.81MB
1
可作为java大数据课程设计使用: 详情查看:https://blog.csdn.net/weixin_46115961/article/details/126061076
1
Hadoop是一个由Apache基金会所开发的分布式系统基础架,是当前最火爆的大数据应用框架,Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算.hdfs作为hadoop重要的组成部分,实现了一个分布式文件系统(Hadoop Distributed File System),HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。本课程详细介绍了从部署linux虚拟机环境到实现全分布式启动hdfs进程的全过程,是快速入门大数据的必经之路.
1
可作为java大数据课程设计使用: 详情查看:https://blog.csdn.net/weixin_46115961/article/details/126061076
1
mapreduce海量数据并行处理总结.pdf
2022-07-14 16:08:58 5.24MB 海量数据挖掘
Hadoop- 单词计数(Word Count)的MapReduce实现.doc
2022-07-13 13:07:28 673KB 技术资料
MongoDB的MapReduce.pdf 学习资料 复习资料 教学资源
2022-07-11 19:06:10 232KB 计算机