java项目Hadoop依赖包,包含MapReduce、hdfs。
2022-03-17 21:45:04 49.47MB Hadoop 依赖包 MapReduce java
1
具有成对约束的聚类最近在聚类社区中引起了很多关注。 特别地,数据集中给定实例对之间的必须链接约束和不能链接约束是当今许多聚类算法中所包​​含的常识。 事实证明,这种方法可以成功地指导许多著名的聚类算法获得更准确的结果。 但是,最近的工作还表明,必须链接约束和不能链接约束的合并使聚类算法对“实例的分配顺序”过于敏感,因此导致了随后的约束冲突。 本文的主要贡献有两个方面。 一种方法是在执行“无法链接”集合的“广度优先”搜索后,通过强调无法链接实例的有序分配来解决Cop-Kmeans中违反约束的问题。 另一个是通过采用MapReduce框架来降低大数据集的Cop-Kmeans计算复杂度。 实验结果表明,我们的方法在海量数据集上表现良好,同时可以克服约束冲突的问题。
2022-03-17 19:27:29 388KB Semi-supervised clustering; Pairwise constraints;
1
通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。通过这一阶段的调研总结,从内部机理的角度详细分析,HDFS、MapReduce、Hbase、Hive是如何运行,以及基于Hadoop数据仓库的构建和分布式数据库内部具体实现。如有不足,后续及时修改。整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持,并通过MR来实现对分布式并行任务处理的程序支持。HDFS采用主从(Master/Slave)结构模型,一个HDFS集群是由一个Nam
1
01_尚硅谷大数据技术之Linux基础.rar 02_尚硅谷大数据技术之Hadoop.rar 03_尚硅谷大数据技术之Zookeeper.rar 04_尚硅谷大数据技术之Hadoop-HA.rar 05_尚硅谷大数据技术之Hive框架基础.rar 06_尚硅谷大数据技术之Flume.rar 07_尚硅谷大数据技术之Oozie.rar 08_尚硅谷大数据技术之HBase.rar 09_尚硅谷大数据技术之Kafka-8.7-8.8.rar 09_尚硅谷大数据技术之杂项.rar 10_尚硅谷大数据技术之Storm-8.8-8.11.rar 11_1离线平台项目测试-8.21-8.22.rar 11_尚硅谷大数据技术之项目:大数据离线平台-8.12-8.18.rar 12_尚硅谷大数据技术之项目:疑犯追踪.rar 13_尚硅谷大数据技术之项目:民航.rar 14_尚硅谷大数据技术之azkaban.rar 15_尚硅谷大数据技术之项目:公安局.rar 16_尚硅谷大数据技术之SpringMVC-8.25-9.1.rar 17_尚硅谷大数据技术之额外项目案例拓展.rar 18_尚硅谷大数据技术之MyBatis-9.2-9.5.rar 19_尚硅谷大数据技术之Maven-9.6.rar 20_尚硅谷大数据技术之Scala-9.8-9.12.rar 21_尚硅谷大数据技术之Spark-9.13-9.22.rar 23_1尚硅谷大数据技术之面试-10.9.rar 23_尚硅谷大数据技术之Redis9.29-9.30.rar 24_尚硅谷大数据技术之ElasticSearch-10.10.rar 25_尚硅谷大数据技术之MongoDB-10.11.rar 26_尚硅谷大数据技术之电影推荐系统-10.13-10.23断断续续.rar 27_尚硅谷大数据技术之滴滴系统.rar) H$ x: f# N% k+ F 28_尚硅谷大数据技术之MySql高级1新-10.24-10.25.rar 28_尚硅谷大数据技术之MySql高级2旧.rar 29_尚硅谷大数据技术之脑图.rar 30_1尚硅谷大数据技术之JavaEE项目十五天-6.22-711.rar 30_尚硅谷大数据技术之JavaEE项目-10.27-11.6.rar 31_1尚硅谷大数据项目之手机APP信息统计分析系统-11.10.rar 31_尚硅谷大数据技术之友盟项目-9.10左右七天.rar 32_备尚硅谷大数据技术之项目:电信客服.rar 32_尚硅谷大数据技术之电信客服.rar 33_尚硅谷大数据技术之JVM-8.12-8.13.rar 34_尚硅谷大数据之深入理解Java虚拟机-8.28-10.15每天晚自习.rar 35_尚硅谷大数据技术之电商数据分析平台项目-11.12.rar IDEA使用指南.rar 京东20万条评论数据.rar 尚硅谷_170508大数据班_javaSE.rar
2022-03-11 20:05:18 2KB hadoop mapreduce hive habase
1
用JAVA多线程实现单机版Map-Shuffle-Reduce,以理解MapReduce原理(蓄水池采用确定reduce范围)
2022-03-02 16:51:34 10KB MapReduce JAVA多线程
1
基于MapReduce的高阶矩阵乘法分布式并行算法研究
2022-02-27 23:25:28 713KB 研究论文
1
Google MapReduce论文 MapReduce: Simplied Data Processing on Large Clusters (中英文对照版)
2022-02-25 17:22:42 611KB MapReduce
1
01_MapReduce框架处理数据的流程及几点注意 02_编写MapReduce编程模块 03_MapReduce数据类型及自定义数据类型 04_案例:网站基本指标分析(一) 05_案例:网站基本指标分析(二) 06_分布式安装部署:克隆虚拟机及配置网络 07_分布式安装部署:集群基本配置及服务运行规划 08_分布式安装部署:集群机器时间同步 09_分布式安装部署:依据规划配置与分发安装包 10_分布式安装部署:启动HDFS、YARN服务及测试程序 11_分布式安装部署:配置主从节点之间的SSH无密钥登录
2022-02-22 09:09:57 89.32MB Hadoop 大数据 分布式安装布署 MapReduce
mapreduce实现文档数据去重
2022-02-11 19:01:35 681KB mapreduce big data 大数据
1
里面包含Hadoop2.7,jdk1.8以及写好的Dockerfile文件,还有配置文件
2022-02-09 20:22:24 344.92MB docker hadoop mapreduce 大数据
1