个人学习spark mllib及hadoop的一些笔记
2020-01-05 00:21:53 2.64MB spark
1
不到一百行的代码教你在spark平台中使用scala实现kmeans算法。简单易懂,大量注释。适合初学者参考理解。本程序在intelliJ IDEA2016.1.1 中编程,运行在spark1.6.1 scala2.10.4本地模式下运行成功。 数据集:(其实‘,’前面的1.0 0.0没用,不过不能删除,除非你修改代码中的数据解析代码) 1.0,0.0 1.1 0.1 0.0,2.0 1.0 -1.0 0.0,2.0 1.3 1.0 1.0,0.0 1.2 -0.5 1.0,1.0 1.4 0.8 1.0,0.3 1.5 1.1 0.0,2.1 1.0 -1.0 0.0,1.0 2.3 1.3 1.0,0.2 0.2 -1.5 1.0,1.0 1.4 2.8
2019-12-21 21:32:06 81KB spark scala kmeans
1
一个完成的spark mllib 协同过滤推荐算法ALS 完整实例程序,基于 spark yarn-client模式运行,另外,包括训练数据。
2019-12-21 19:29:16 866KB spark mllib ALS pyspark
1