只为小站
首页
域名查询
文件下载
登录
Hadoop权威指南
hadoop权威指南,第二版,中文,介绍了hadoop的一些相关概念,以及开发过程中所需要用到的相关子项目,如hbase等。
2023-10-10 17:55:02
32.44MB
hadoop指南
1
大数据技术原理与应用概念、存储、处理、分析与应用
林子雨的书 关于大数据的 如果想要学习大数据的同学 又是恰好刚刚入门的话推荐这本
2023-09-28 08:44:14
78.9MB
Hadoop
HBase
HDFS
1
Spark-Core学习知识笔记整理
Spark-Core文档是本人经三年总结笔记汇总而来,对于自我学习Spark核心基础知识非常方便,资料中例举完善,内容丰富。具体目录如下: 目录 第一章 Spark简介与计算模型 3 1 What is Spark 3 2 Spark简介 3 3 Spark历史 4 4 BDAS生态系统 4 5 Spark与Hadoop的差异 5 6 Spark的适用场景 6 7 Spark成功案例 6 第二章 Spark开发环境搭建 8 1 Spark运行模式 8 2 Spark环境搭建 8 2.1Scala的安装 8 2.2Spark的单节点配置 9 2.3Spark-Standalone集群配置 9 2.4Spark-on-Yarn模式配置 12 2.5Spark-on-Mesos模式配置 13 2.6Hive-on-Spark配置 13 第三章 Spark计算模型 15 1 RDD编程 15 1.1弹性分布式数据集RDD 15 1.2构建RDD对象 15 2RDD操作 15 2.1将函数传递给Spark 16 2.2了解闭包 16 2.3Pair RDD模型 17 2.4Spark常见转换操作 18 2.5Spark常见行动操作 20 2.6RDD持久化操作 21 2.7注意事项 23 2.7并行度调优 24 2.8分区方式 25 3Examle:PageRank 27 第四章 Spark编程进阶 29 1共享变量 29 1.1累加器 30 1.2广播变量 31 2基于分区进行操作 32 3与外部程序间的管道 33 4数值RDD的操作 34 5 Spark Shuffle机制 34 第五章 Spark调优与调试 39 1开发调优: 40 1.1调优概述 40 1.2原则一:避免创建重复的RDD 40 1.3原则二:尽可能复用同一个RDD 41 1.4原则三:对多次使用的RDD进行持久化 42 1.5原则四:尽量避免使用shuffle类算子 43 1.6原则五:使用map-side预聚合的shuffle操作 44 1.7原则六:使用高性能的算子 45 1.8原则七:广播大变量 46 1.9原则八:使用Kryo优化序列化性能 47 1.10原则九:优化数据结构 48 2资源调优 48 2.1调优概述 48 2.2 Spark作业基本运行原理 49 2.3资源参数调优 50 第六章 Spark架构和工作机制 52 1 Spark架构 52 1.1 Spark架构组件简介 52 1.2 Spark架构图 54 2 Spark工作机制 54 2.1 Spark作业基本概念 54 2.2 Spark程序与作业概念映射 55 2.3 Spark作业运行流程 55 3 Spark工作原理 55 3.1 作业调度简介 55 3.2 Application调度 56 3.3 Job调度 56 3.4 Tasks延时调度 56 第七章 Spark运行原理 57 1 Spark运行基本流程 57 2 Spark在不同集群中的运行架构 58 2.1 Spark on Standalone运行过程 59 2.2 Spark on YARN运行过程 60
2023-09-26 13:01:48
6.54MB
Spark
初学者
大数据
资料归档
1
hadoop-2.7.2-common.jar
hadoop-2.7.2-connon.jar,重新编译了其中的NativeIO,可以用在windows下,不会报UnsatisfiedLinkedError了
2023-09-24 15:34:07
3.32MB
hadoop-2.7.2
1
基于SpringCloud+Hadoop+Vue的企业级网盘系统设计与实现源码
基于SpringCloud+Hadoop+Vue的企业级网盘系统设计与实现源码 华东交通大学,优秀毕业设计分享 前端:vue-projectManage 后台:mycloud-admin 提供前端服务:mycloud ps:springcloud实现 文件在线预览服务:file-online-preview 基于SpringCloud+Hadoop+Vue企业网盘系统主要分为前台和后台两大模块,前台模块分为首页,网盘,分享,资源库,关注用户,系统公告模块,不同的功能模块拥有的功能也是不相同的。此外,所需权限也不同。后台模块分为用户、部门、角色、网盘、日志、系统监控、接口文档、定时任务模块。在网络磁盘管理模块中,管理员可以上传、删除和修改文档,管理员还可以在线查看多媒体资源,如Word文档、视频、音乐、图片。 管理员和超级管理员成功登入系统后台后,默认会调到Index页面去,在该首页,我们可以看到登录用户、服务器运行相关信息。在数据大盘模块,可以看到最近上传文件的数量,以及最近一段时间的上传曲线图。系统超级管理员可以管理系统所有的功能和所有用户。
2023-09-16 16:43:04
248.57MB
java源码
Spring框架
项目源码
毕业设计
1
论文研究-一种基于Kafka/Hadoop/Hive平台的大规模智慧路灯的数据采集与处理系统 .pdf
一种基于Kafka/Hadoop/Hive平台的大规模智慧路灯的数据采集与处理系统,何沙,肖波,随着信息科技的飞速发展,智慧路灯出现在了人们视野中。区别于普通路灯,智慧路灯集成了很多智能模块。这些模块实时地向服务器上
2023-09-12 10:15:56
542KB
大规模智慧路灯
1
解决sqoop2导入hdfs单引号问题
使用sqoop2从mysql导入hadoop时,导入的数据带单引号。是由于sqoop2的一个bug导致,该包上传到sqoop_home/server/lib替换原来的jar包后,重启sqoop server,即可解决。
2023-07-27 10:47:53
20.76MB
sqoop2
单引号
hadoop
mysql
1
hadoop权威指南第四版中英文pdf及源码
hadoop权威指南第四版中英文pdf及源码,内容以Hadoop2.x为主,包含一些hadoop的stable版本的新特性,与以前版本比较增加了介绍YARN , Parquet , Flume, Crunch , Spark的章节。适合于Hadoop 初学者。
2023-07-20 15:47:16
195.46MB
hadoop
权威指南
第四版
1
HDFS文件系统JAVA api访问接口(基于hadoop大数据平台)
在搭建完hadoop大数据系统(CDH5.16.1)后,如何访问hdfs文件系统上的数据呢?那当然是通过构建maven项目 使用java api接口进行文件了。为此,特别进行了hdfs文件系统java api访问的整理。
2023-06-19 17:24:42
13KB
HDFS
HADOOP
JAVA
API
1
hadoop-2.6.0-cdh5.16.2的压缩包.rar
主要是因为hadoop的cdh5官网收费,项目下载不了了,上传我下载的到csdn方便各位下载
2023-06-06 09:34:48
241.69MB
hadoop-2.6.0-cdh
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Elsevier爱思唯尔的word模板.zip
华为OD机试真题.pdf
2019西门子杯六部十层电梯群控参考程序.zip
PSO-LSSVM的MATLAB代码.rar
工程伦理_李正风,丛杭青,王前_北京:清华大学出版社 , 2016.08_P329.pdf
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
DBSCAN算法Matlab实现
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
西安问题电缆-工程伦理案例分析.zip
IEEE33节点配电网Simulink模型.rar
voc车辆检测数据集(已处理好,可直接训练)
2022学术英语写作(东南大学) 章节测试+期末test答案
基于YOLOV5的车牌定位和识别源码.zip
基于OpenCV的车牌号码识别的Python代码(可直接运行)
Plex v7.12电视端app
最新下载
南开大学编译原理各章作业答案
东芝机械手THL800各种说明书编程软件例子
设备管理系统(VB+ACCESS)
通信系统仿真实验报告
2018泰迪杯数据挖掘c题(酒店、景区评论分析)
山东大学数据科学导论复习资料PPT课件+2018年真题
MTDriver-TJ-V5.15-盈亏统计指标
E083-Python安全渗透测试-UDP FLOOD网络渗透测试.pdf
编译原理udp flood 攻击实验报告
renren-fast开源开发文档3.0完整版(含源程序)
其他资源
计算机图形学 猫变虎作业
大华摄像头通过webplugin.exe实现web界面视频预览,亲测可用,免费下载
无线模块 cc1101+例子程序+原理图
LQR路径跟踪.rar
微机原理课程设计(各种)
篮球竞赛30秒计时器的设计与实现-数字电子技术课程设计
斗地主(JAVA)
STM32的无线图像采集传输系统的软件设计
OpenGL法向量计算实例
广播通信 WinSock编程.rar
libmp4v2-录制h265 格式视频-mp4录像-c语言
技术标书 - 中华联合20150902.doc
WS 445.5-2013 电子病历基本数据集 第5部分:一般治疗处置记录.pdf
React-ToDoList-源码
永磁同步电动机的混沌分析及线性反馈控制
网络性能测试Netperf工具使用指导.docx
MSI SCM x64 14.013.07054 for win7
电子科技大学2003博士考试随机过程试题
OpenGLTexture
3D Infinite Runner Toolkit
在线名片设计网站需求分析
listView嵌套GridView的demo
TwinCAT 2 PLC入门教程V2.3
基于ZigBee的多功能有害气体检测软件程序和硬件电路和说明文档