Spark2.x机器学习实战,本课程主要讲解基于Spark 2.x的机器学习库,MLlib实现了常用的机器学习,如:聚类、分类、回归等6大算法,使用Kaggle竞赛数据集模型构建。本课拒绝枯燥的讲述,将循序渐进从Spark2.x的基础知识开始,然后再透彻讲解各个算法的理论、详细展示Spark实现,最后均会通过实例进行解析实战,帮助大家真正从理论到实践全面掌握Spark MLlib分布式机器学习。通过该课程的学习同学们可以全面掌握Spark MLlib机器学习,进而能够在实际工作中进行ML的应用开发和定制开发。
2021-08-09 17:39:38 1KB spark kaggle 机器学习 大数据
1
Spark2.x企业级大数据项目实战(实时统计、离线分析和实时ETL),本门课程来源于一线生产项目, 所有代码都是在现网大数据集群上稳定运行, 拒绝Demo。课程涵盖了离线分析、实时分析绝大部分的场景,通过三个实际生产项目教授如何优雅地集成Hadoop、Spark、HBase、Kafka、Redis、MySQL等相关大数据技术,并实际落地 。
2021-08-09 13:17:46 1KB 大数据 spark
1
用于Spark3.0.0的模式配置
2021-08-09 13:17:46 214.06MB spark
1
Analytics Zoo提供统一的分析+ AI平台,可将Spark,TensorFlow,Keras和BigDL程序无缝集成到一个集成的管道中; 然后,整个管道可以透明地扩展到大型Hadoop / Spark集群,以进行分布式训练或推理。 Apache Spark/Flink & Ray 上分布式 TensorFlow、Keras 和 PyTorch 的统一数据分析和人工智能平台 什么是 Analytics Zoo? Analytics Zoo 将 TensorFlow、Keras 和 PyTorch 无缝扩展到分布式大数据(使用 Spark、Flink 和 Ray)。 将 AI 模型(TensorFlow、PyTorch、OpenVINO 等)应用于分布式大数据的端到端管道 编写 TensorFlow 或 PyTorch 内联 Spark 代码,用于分布式训练和推理。 Spark ML Pipelines 中的原生深度学习(TensorFlow/Keras/PyTorch/BigDL)支持。 通过RayOnSpark直接在大数据集群上运行Ray程序。 用于(Ten
2021-08-08 11:42:45 46.82MB 机器学习
1
spark-2.4.6-bin-hadoop2.7.tgz 官网下载不了的,可以在这里下载哦,csdn很稳哦
2021-08-07 01:26:41 222.41MB spark
1
Spark 2.x + Python 大数据机器学习实战,本课程系统讲解如何在Spark2.0上高效运用Python来处理数据并建立机器学习模型,帮助读者开发并部署高效可拓展的实时Spark解决方案。
2021-08-06 12:16:34 736B spark python 机器学习
1
Spark大数据处理技术PDF 高清带目录完整版 夏俊鸾黄洁程浩等人著作 学习大数据值得拥有
1
使用 F# 探索 Spark 和 ML.NET 此存储库包含代码 设想 训练和部署机器学习模型,使用诸如严重违规次数、违规类型等特征来预测检查后给予餐厅的分数。 先决条件 项目资产 data - 原始数据集的位置。 Web API - F# Saturn Web API 来托管InspectionModel.zip回归模型。 Domain.fs - 包含模型输入和输出的模式。 Program.fs - Web API 入口点 检查模型.zip - 预测餐厅检查分数的回归模型 data-exploration.dib - 用于探索和可视化数据的 .NET 交互式笔记本。 data.fsx - 用于准备训练数据的 F# 交互式脚本。 machine-learning.fsx - 用于训练回归模型的 F# 交互式脚本。 submit.cmd - 在调试模式下为 Apache S
2021-08-04 14:05:31 2.53MB HTML
1
大数据环境搭建——>Spark安装配置
2021-08-03 21:05:38 305KB 大数据