使用NVIDIA CUDA的“阴阳” K均值和K-nn K均值的实现基于 。 尽管它引入了一些开销和许多对CUDA不利的条件子句,但与Lloyd算法相比,它仍然显示出1.6到2倍的加速。 K近邻采用相同的三角形不等式思想,并且需要预先计算的质心和聚类分配,类似于展平的球树。 sklearn KMeans KMeansRex KMeansRex OpenMP 塞班 克库达 kmcuda 2 GPU 速度 1倍 4.5倍 8.2倍 15.5倍 17.8倍 29.8倍 记忆 1倍 2倍 2倍 0.6倍 0.6倍 0.6倍 从技术上讲,该项目是一个共享库,可导出kmcuda.h定义的两个函数: kmeans_cuda和knn_cuda 。 它具有内置的Python3和R本机扩展支持,因此您可以from libKMCUDA import kmeans_cuda或dyn.load("libKMCUDA.so") 。 目录 K均值 该项目与其他项目之间的主要区别在于,kmcuda已针对内存消耗低和大量群集进行了优化。 例如,kmcuda可以将480个维度中的4M个样本分类为40000个
2021-05-12 19:32:49 423KB python machine-learning cuda knn-search
1
在配置完环境以后运行程序,程序正常运行但是GPU没有任务,此时判断程序没有在GPU上运行。调试步骤: 先查看cuda安装有没有问题:nvcc -V                                  可以看到cuda驱动等安装没有问题。 进程序去看.cuda()或者.todevice之类代码,看程序确实放在GPU上了,故排除 但是在查看代码是看到这里是一个and,参数args.no_cuda是设置的Flase,所以问题因为在torch.cuda.is_available(),没有获得cuda加速。 查看深度学习环境搭建torch.cuda.is_available()这里返回了
2021-05-12 17:18:58 67KB ab al ble
1
基于CUDA的并行计算技术+opencv完成图像高斯滤波和双边滤波,开发版本为VS2019+openCV3.4
2021-05-12 15:44:19 35.5MB 虚拟现实 游戏开发 c++ GPU运算
1
提供cuda 10.1 下载链接,pytorch 学习的前提,软件的地址因为是国外的,该地址下载会比较快
2021-05-11 14:52:57 78B cuda cuda10 pytorch cuda
1
CUDA平台加速粒子群优化算法(pso),自己实现,结构清晰,加速比可达到10倍左右,适合初学者,因为还有一定的优化空间。
2021-05-11 11:43:37 447KB cuda pso 粒子群 优化算法
1
并行计算 目录 并行计算基础 并行计算简介 并行计算机结构模型 基础并行算法 经典算法的并行计算 矩阵计算 线性方程组 经典迭代算法 特征值问题 智能计算 并行编程 消息传递编程接口 MPI 共享存储并行编程 openMP GPU并行加速技术 CUDA
2021-05-11 09:18:13 5KB
1
cmake3.17编译 OpenCV4.3部分文件无法下载,我用的是vs2015, x64模式来进行编译的,具体文件见压缩包,需要的自取。
2021-05-10 17:09:04 182.95MB OpenCV CMAKE VS2015 CUDA
1
cudnn-10.0-linux-x64-v7.5.1.10.tgz
2021-05-10 16:01:06 412.76MB cuda
1
windows10适用的cuda工具包,可以用于深度学习的训练,从官网可以下载,安装成功后可以用nvcc --verison查看cuda版本
2021-05-10 12:44:23 16.44MB cuda10
1
vs2010开发,CUDA6.5实现光线跟踪,初学者可以看看
2021-05-08 16:37:59 349KB CUDA 并行计算 光线跟踪实现
1