Apache Spark 2.x for Java Developers,使用Java开发Spark
2021-11-17 11:31:11 7.98MB spark2.X spark
1
PySpark大数据处理及机器学习Spark2.3视频教程,本课程主要讲解Spark技术,借助Spark对外提供的Python接口,使用Python语言开发。
2021-11-10 18:11:44 541B PySpark Spark2.3 大数据 机器学习
1
SPARK2.3 如果资源有问题请加Q:2625039362
2021-11-03 19:00:30 545.98MB SPARK2.3 CDH SPARK
org.spark-project.hive 源码, The Apache Hive (TM) data warehouse software facilitates querying and managing large datasets residing in distributed storage.
2021-10-30 11:41:46 21.68MB hive spark saprk-project.hi
1
spark2.1集群安装
2021-10-14 20:56:48 14KB spark2.1
1
spark2.2是一个里程碑的版本,因为之前的版本很多特性都是实验性的,所以2.2是第一个真正完全可以把Spark的所有特性在生产环境中时候用的版本。 笔记的含金量集结了整个spark2.2源码的精华,不会多一点延伸内容,因为我们读源码是为了在性能调试以及线上故障的时候能够快速看懂log日志,然后准确找到问题根源,是修改程序代码还是调整配置,所以笔记不会把一个言简意赅的东西说那么复杂,因为不是出书;当然也不会少一点整个spark内核架构,只要干这一行掌握的关键源码知识都会含在笔记里。
2021-10-08 11:07:21 1.24MB 笔记
1
基于Spark2.x机器学习十大案例全方位剖析视频教程 十大案例全方位剖析: 案例1、基于Kaggle的StumbleUpon数据集构建分类系统 案例2、基于BikeSharing数据集构建回归模型 案例3、基于NewsCorpora数据集文本处理新闻分类 案例4、基于KMeans网络流量检测模型 案例5、基于Kaggle Avazu广告数据集构建CRT预测模型 案例6、基于聚类KMeans出租车轨迹分析 案例7、基于决策树预测森林植被 案例8、基于DataFrame API ML预测森林植被 案例9、基于Audioscrobbler数据集的音乐推荐 案例10、基于MovieLens数据集的电影推荐
2021-09-27 11:05:21 986B spark 机器学习
1
Spark2.x机器学习实战(算法篇:基于Kaggle竞赛数据集,六大算法模型构建),本课程主要讲解基于Spark 2.x的机器学习库,MLlib实现了常用的机器学习,如:聚类、分类、回归等6大算法,使用Kaggle竞赛数据集模型构建。本课拒绝枯燥的讲述,将循序渐进从Spark2.x的基础知识开始,然后再透彻讲解各个算法的理论、详细展示Spark实现,最后均会通过实例进行解析实战,帮助大家真正从理论到实践全面掌握Spark MLlib分布式机器学习。通过该课程的学习同学们可以全面掌握Spark MLlib机器学习,进而能够在实际工作中进行ML的应用开发和定制开发。
2021-08-11 14:15:10 1KB spark 机器学习
1
Spark2.x机器学习实战,本课程主要讲解基于Spark 2.x的机器学习库,MLlib实现了常用的机器学习,如:聚类、分类、回归等6大算法,使用Kaggle竞赛数据集模型构建。本课拒绝枯燥的讲述,将循序渐进从Spark2.x的基础知识开始,然后再透彻讲解各个算法的理论、详细展示Spark实现,最后均会通过实例进行解析实战,帮助大家真正从理论到实践全面掌握Spark MLlib分布式机器学习。通过该课程的学习同学们可以全面掌握Spark MLlib机器学习,进而能够在实际工作中进行ML的应用开发和定制开发。
2021-08-09 17:39:38 1KB spark kaggle 机器学习 大数据
1
Spark2.x企业级大数据项目实战(实时统计、离线分析和实时ETL),本门课程来源于一线生产项目, 所有代码都是在现网大数据集群上稳定运行, 拒绝Demo。课程涵盖了离线分析、实时分析绝大部分的场景,通过三个实际生产项目教授如何优雅地集成Hadoop、Spark、HBase、Kafka、Redis、MySQL等相关大数据技术,并实际落地 。
2021-08-09 13:17:46 1KB 大数据 spark
1