使用NVIDIA CUDA的“阴阳” K均值和K-nn
K均值的实现基于 。 尽管它引入了一些开销和许多对CUDA不利的条件子句,但与Lloyd算法相比,它仍然显示出1.6到2倍的加速。 K近邻采用相同的三角形不等式思想,并且需要预先计算的质心和聚类分配,类似于展平的球树。
sklearn KMeans
KMeansRex
KMeansRex OpenMP
塞班
克库达
kmcuda 2 GPU
速度
1倍
4.5倍
8.2倍
15.5倍
17.8倍
29.8倍
记忆
1倍
2倍
2倍
0.6倍
0.6倍
0.6倍
从技术上讲,该项目是一个共享库,可导出kmcuda.h定义的两个函数: kmeans_cuda和knn_cuda 。 它具有内置的Python3和R本机扩展支持,因此您可以from libKMCUDA import kmeans_cuda或dyn.load("libKMCUDA.so") 。
目录
K均值
该项目与其他项目之间的主要区别在于,kmcuda已针对内存消耗低和大量群集进行了优化。 例如,kmcuda可以将480个维度中的4M个样本分类为40000个
1