分享课程——Spark3+Clickhouse+Hadoop大数据实战课程,2021新课,提供代码、课件和软件下载。 另外通过项目驱动,掌握Spark框架的精髓,教导Spark源码查看的技巧;会学到Spark性能优化的核心要点,成为企业急缺的数据分析人才;更会通过Clickhouse和Spark搭建OLAP引擎,使学员对大数据生态圈有一个更加全面的认识和能力的综合提升。真实的数据分析项目,学完即可拿来作为自己的项目经验,增加面试谈薪筹码。
2021-10-25 18:11:58 765B Spark Clickhouse Hadoop 大数据
1
SPARK与Handoop的学习.docx
2021-10-25 17:03:05 230KB 学习交流
1
这是官网下载的配置好的 pyspark 安装包 spark-2.3.0-bin-2.6.0-cdh5.7.0.tar.gz,可以直接解压使用
2021-10-24 19:35:44 203.52MB hadoop
1
该包可以启动spark的thriftserver。可以解决报错failed load org.apache.spark.sql.hive.thriftserver.HiveThriftServer2的报错。
2021-10-21 21:01:57 200.37MB thriftserver spark sparksql sql
1
完成该项目的scala程序文件
2021-10-21 19:08:13 4KB spark scala
官网下载慢
2021-10-21 09:07:27 220.16MB spark
1
点击率模型 基于纯Spark MLlib的CTR预测模型,无第三方库。 实现模型 朴素贝叶斯 逻辑回归 分解机 随机森林 梯度提升决策树 GBDT + LR 神经网络 内部产品神经网络(IPNN) 外部产品神经网络(OPNN) 用法 这是一个行家项目。 Spark版本是2.3.0。 Scala版本是2.11。 在maven自动导入依赖项之后,您可以简单地运行示例函数( com.ggstar.example.ModelSelection )来训练所有CTR模型并获得所有模型之间的指标比较。 有关点击率预测的相关论文 其他资源
2021-10-20 17:07:59 57KB machine-learning scala spark ctr-prediction
1
spark替代Hive实现ETL作业
2021-10-20 01:44:13 1.41MB etl spark hive 替代hive
1
Spark源码
2021-10-19 14:13:33 14KB Spark源码
1
分享课程-Spark3+Clickhouse+Hadoop大数据实战课程。本课程采用项目驱动的方式,以Spark3和Clickhouse技术为突破口,带领学员快速入门Spark3+Clickhouse数据分析,促使学员成为一名高效且优秀的大数据分析人才。
2021-10-19 14:09:37 771B spark hadoop Clickhouse
1