完成该项目的scala程序文件
2021-10-21 19:08:13 4KB spark scala
官网下载慢
2021-10-21 09:07:27 220.16MB spark
1
点击率模型 基于纯Spark MLlib的CTR预测模型,无第三方库。 实现模型 朴素贝叶斯 逻辑回归 分解机 随机森林 梯度提升决策树 GBDT + LR 神经网络 内部产品神经网络(IPNN) 外部产品神经网络(OPNN) 用法 这是一个行家项目。 Spark版本是2.3.0。 Scala版本是2.11。 在maven自动导入依赖项之后,您可以简单地运行示例函数( com.ggstar.example.ModelSelection )来训练所有CTR模型并获得所有模型之间的指标比较。 有关点击率预测的相关论文 其他资源
2021-10-20 17:07:59 57KB machine-learning scala spark ctr-prediction
1
spark替代Hive实现ETL作业
2021-10-20 01:44:13 1.41MB etl spark hive 替代hive
1
Spark源码
2021-10-19 14:13:33 14KB Spark源码
1
分享课程-Spark3+Clickhouse+Hadoop大数据实战课程。本课程采用项目驱动的方式,以Spark3和Clickhouse技术为突破口,带领学员快速入门Spark3+Clickhouse数据分析,促使学员成为一名高效且优秀的大数据分析人才。
2021-10-19 14:09:37 771B spark hadoop Clickhouse
1
Scala代码积累之spark streaming kafka 数据存入到hive源码实例,Scala代码积累之spark streaming kafka 数据存入到hive源码实例。
2021-10-19 13:38:34 3KB Scala
1
手把手视频详细讲解项目开发全过程,需要的小伙伴自行百度网盘下载,链接见附件,永久有效。 课程介绍 从基础知识点到安装部署、集群配置、各种服务安装到增加新节点,通过知识点 + 实际操作的方式帮助小白快速掌握CDH的安装和配置。 课程亮点 1,Cloudera Manager可视化、自动部署和配置,稳定性好 2,理论+操作,培养解决实际问题的能力。 3,涉及到大数据离线和实时主流服务安装。 适用人群 1、对大数据感兴趣的在校生及应届毕业生。 2、对目前职业有进一步提升要求,希望从事大数据行业高薪工作的在职人员。 3、对大数据行业感兴趣的相关人员。 课程内容 1. 大数据架构和技术选型 2. 虚拟机环境 3. Cloudera Manager 4. 添加HDFS服务 5. 添加Yarn服务 6. 添加Zookeeper服务 7. 添加Hive服务 8. 添加Oozie服务 9. 添加Sqoop服务 10. 添加HBase服务 11. 添加Spark服务 12. 添加Hue服务 13. 添加新服务器
2021-10-18 20:10:41 75B ClouderaManager CDH spark hive
Spark 2.3.3 安装包,配合本人博客《Spark 2.3 安装部署》一同使用
2021-10-18 20:10:35 216.51MB spark
1
Linux系统 大数据开发 spark-2.1.0-bin-without-hadoop.tgz
2021-10-18 18:06:23 117.44MB spark
1