背景:某地区多所学校因为疫情原因,需要采取网上授课的模式进行教学工作。为了更好的管理教学、授课、考评、检查、行政、科研以及后勤等工作,计划搭建一套大数据管理平台来做为各系统的支持与开发工作。
1
hadoop2.7.6、连接eclipse
2022-12-26 19:27:08 576.61MB hadoop连接eclipse
1
《Hadoop 2.X HDFS源码剖析》以Hadoop 2.6.0源码为基础,深入剖析了HDFS 2.X中各个模块的实现细节,包括RPC框架实现、Namenode实现、Datanode实现以及HDFS客户端实现等。《Hadoop 2.X HDFS源码剖析》一共有5章,其中第1章从总体上介绍了HDFS的组件、概念以及典型的流程,同时详细介绍了HDFS各个组件间RPC接口的定义。第2章介绍了Hadoop RPC框架的实现,Hadoop RPC是HDFS各个组件间通信所依赖的底层框架,可以理解为HDFS的神经系统。第3~5章分别介绍了Namenode、Datanode以及HDFS客户端这三个组件的实现细节,同时穿插介绍了HDFS 2.X的新特性,例如Namenode HA、Federation Namenode等。 阅读《Hadoop 2.X HDFS源码剖析》可以帮助读者从架构设计与源码实现角度了解HDFS 2.X,同时还能学习HDFS 2.X框架中优秀的设计思想、设计模式、Java语言技巧以及编程规范等。这些对于读者全面提高自己的技术水平有很大的帮助。
2022-12-25 20:27:00 306.67MB Hadoop
1
为了有效的演示实验,更好的将理论与实验相结合,博主制作了本实验报告。本实验中分别有构建虚拟机网络。大数据环境安装以及大数据分析案例三部分实验,希望对大家有所帮助。 Hadoop简介: Hadoop 是由 Apache 研发的开源分布式基础架构,它由 Hadoop 内核、MapReduce、 Hadoop 分布式文件系统(HDFS)及一些相关项目组成。其中,HDFS具有高容错性,负责大数据存储;MapReduce 则负责对 HDFS 中的大量数据进行复杂的分布式计算。Hadoop 作为分布式架构,采用“分而治之”的设计十思想:将大量数据分布式地存放于大量服务器上,采用分治的方式对大数据进行分析。 在这种思想的驱使下,Hadoop 实现了 MapReduce 的编程范式。其中,“Map”意为映射 其工作是将一个键值对分解为多个键值对;“Reduce”意为归约,其工作是将多组键值产对处理合并后产生新的键值对写入 HDFS。通过上述工作原理,MapReduce 实现了将大数据工作拆分为多个小规模数据任务在大量服务器上分布式处理。
1
分布式系统的可靠协调系统 应用程序 协调服务 Hadoop 配置维护 域名服务 分布式同步
2022-12-22 20:15:47 17.46MB 分布式系统 Hadoop 配置维护 域名服务
1
基于最新版本的湖仓一体、流批一体架构方案 hadoop-3.3.4+tez-0.10.2+hive-3.1.3+hbase-2.4.14+atlas-2.2.0+kafka- 2.8.2+ranger-2.3.0+flink-1.15.2+spark-3.3.0+hudi-0.12.1.jar+iceberg-0.14.1.jar+streamx
2022-12-21 19:23:13 51B hadoop hudi iceberg flink
1
远程模式部署Hive时,mysql连接驱动jar包,需先进行解压,解压后文件夹内压缩包即为用到的压缩包,全称为mysql-connector-java-5.1.32.jar
2022-12-21 14:25:40 896KB hive hadoop
1
关于云计算 负载均衡的资料,一般关于hadoop方面
2022-12-20 16:21:53 998KB 云计算 负债均衡 hadoop
1
hadoop环境配置与实验报告.pdf
2022-12-20 14:21:26 1.99MB 文档资料
1
hadoop-eclipse-plugin-2.8.3.jar hadoop eclipse插件,hadoop版本2.8.3,eclipse版本oxygen,亲测可以,用问题请留言:http://blog.csdn.net/familyshizhouna/article/details/78892500
2022-12-20 12:20:45 35.98MB hadoop 2.8.3 eclipse oxygen
1