搜索【spark 】的结果

Spark on Yarn模式部署.docx

2021-10-13 13:08:04 1.17MB spark配置

1

Spark MLlib 机器学习算法与源码解析

此课程主要介绍spark ml相关内容，共分10章，前2章主要介绍scala、spark原理，后面每章一个算法应用、算法原理和算法源码讲解，非常有帮助。

2021-10-12 20:35:48 75B spark ml

1

scala.xmind

适合初学和巩固基础的人

2021-10-12 19:07:36 213KB scala 大数据 spark 知识点

analytics-zoo：Apache SparkFlink和Ray上的分布式Tensorflow，Keras和PyTorch-源码

用于Apache Spark / Flink和Ray上的分布式TensorFlow，Keras和PyTorch的统一数据分析和AI平台什么是Analytics Zoo？ Analytics Zoo无缝地将TensorFlow，Keras和PyTorch扩展到分布式大数据（使用Spark，Flink和Ray）。用于将AI模型（TensorFlow，PyTorch，OpenVINO等）应用于分布式大数据的端到端管道使用Spark代码内联编写或以进行分布式训练和推理。管道中的本机深度学习（TensorFlow / Keras / PyTorch / BigDL）支持。通过RayOn

2021-10-12 16:22:57 43.62MB python scala apache-spark pytorch

1

spark thriftserver(或hive)基于mysql8.x元数据库

支持mysql8.x，使用utf8mb4编码。

2021-10-12 14:09:27 30KB hive库 utf8mb4 thriftserver元数据库

1

硬核剖析三大运营商电信信号强度诊断项目实战视频教程

手把手视频详细讲解项目开发全过程，需要的小伙伴自行百度网盘下载，链接见附件，永久有效。课程亮点： 1、系统的设计方法是采用面向对象的设计。本系统前端页面交互主要采用B/S的结构，采用MVC及流式数据的设计思路进行规划设计。 2、前端数展现使用Echarts技术。与地图相关的报表使用百度地图提供的API。 3、后端实时数据，实时接入mysql。为了不影响线上系统的正常使用，同时能够将数据发送到大数据平台，本项目使用Canal来解析实时数据，Flume收集数据并数据发送到实时计算业务流程和离线计算两个流程中。实时数据处理流程使用Canal+Flume+Kafka+SparkStreaming等技术。离线计算使用HDFS+Hive+Azkaban等技术。 4、设计过程中对系统的可靠性、可扩展性以及性能进行了充分考虑和研究分析，争取通过良好的设计，在实现系统功能的前提下，最大化的提高系统性能和扩展性，减少将来的维护代价和其他成本。适用人群： 1、对大数据Spark感兴趣的在校生及应届毕业生。 2、对目前职业有进一步提升要求，希望从事大数据行业高薪工作的在职人员。 3、对大数据行业感兴趣的相关人员。第一章项目概述 1课程内容 1. 系统介绍 2. 模块介绍 3. 数据流程描述 4. 逻辑架构设计 5. 功能描述 6. 系统架构第二章离线数据入库 1. 数据上传 2. 创建数据表 3. 数据拆分 4. 数据表加载第三章离线数据整理 1. 业务SQL语句编写 2. 整理SQL语句生成结果表的结构及字段 3. 根据结果表所需的字段，在原始表中抽取该字段 4. 数据加工及入库 5. 创建索引第四章实时数据生成及计算 1. Mysql 数据写入 2. canal 解析mysql实时数据写入本地 3. Flume收集数据将数据上传至集群 4. SparkStreaming 实时计算

2021-10-12 14:09:20 75B spark flume 大数据 canal

Spark 的两种核心 Shuffle 详解.pdf

Spark Shuffle 分为两种：一种是基于 Hash 的 Shuffle；另一种是基于 Sort 的 Shuffle。

2021-10-09 19:06:19 1.61MB SparkShuffle

Ubuntu下安装spark.pdf

2021-10-09 10:02:10 2.05MB 安装

小坨的Spark分布式集群环境搭建小笔记

文章目录写在前面搭建好Hadoop集群环境安装Spark（Master节点上操作）配置环境变量（Master节点上操作）Spark配置（Master节点上操作）配置Worker节点启动Spark集群（在Master节点上操作）关闭Spark集群（在Master节点上操作）写在前面这里采用2台机器（节点）作为实例来演示如何搭建Spark集群，其中1台机器作为Master节点，另外一台机器作为Slave1节点（即作为Worker节点）。集群环境 Centos6.4 Hadoop2.7.7 java 1.8 （请确保java版本在1.8以上，否则会踩坑，反正我后面踩了）搭建好Hadoop集

2021-10-09 09:39:50 110KB ar ark 分布

1

apache-hive-2.2.0-bin.tar.gz

apache-hive-2.2.0-bin.tar.gz apache-hive-2.2.0-bin.tar.gz

2021-10-07 20:06:25 208.08MB hive hadoop apache spark

1

个人信息

热门下载

最新下载

其他资源