COM6012可扩展机器学习-谢菲尔德大学
2021年Spring,(1-5)和(6-10)
在,我们将学习如何使用大规模的机器学习。 我们将使用我们大学的。 您必须使用连接到HPC。
该版本使用的 (2020年9月2日),并且在下面进行了10节。 您可以参考以获取更多信息,例如时间表和评估信息。
第一场:Spark和HPC简介
第2节:RDD,DataFrame,ML管道和并行化
专题三:可扩展的矩阵分解,用于推荐系统中的协同过滤
第四节:可扩展的k-means聚类和Spark配置
主题5:可伸缩的PCA,用于降维和Spark数据类型
第六节:高级决策树
第七讲:可扩展的逻辑回归
第八讲:可扩展的广义线性模型
主题9:可伸缩神经网络
第十部分:云中的Apache Spark( 客座演讲
您也可以下载以供预览或参考。
致谢
这些材料是参考以下资源构建的:
官方的。 注意:最新信息
1