不到一百行的代码教你在spark平台中使用scala实现kmeans算法。简单易懂,大量注释。适合初学者参考理解。本程序在intelliJ IDEA2016.1.1 中编程,运行在spark1.6.1 scala2.10.4本地模式下运行成功。
数据集:(其实‘,’前面的1.0 0.0没用,不过不能删除,除非你修改代码中的数据解析代码)
1.0,0.0 1.1 0.1
0.0,2.0 1.0 -1.0
0.0,2.0 1.3 1.0
1.0,0.0 1.2 -0.5
1.0,1.0 1.4 0.8
1.0,0.3 1.5 1.1
0.0,2.1 1.0 -1.0
0.0,1.0 2.3 1.3
1.0,0.2 0.2 -1.5
1.0,1.0 1.4 2.8
1