ubuntu18.04,先装显卡驱动,后cuda、cudnn
2021-06-24 20:06:24 2KB AI
1
nccl本地安装包,适合ubuntu20.04及cuca11.0以上版本
2021-06-23 19:11:09 78.98MB cuda nccl 深度学习 mxnet
1
cuda进行高斯列主消元求解方程组的解,并于cpu求解进行速度比较。矩阵值为随机数,矩阵大小可进行调整,来比较不同维度的矩阵求解的速度。
1
在VS2005环境下,使用CUDA编程实现SAR成像中CSA算法的实现,得到了很好的加速比。-
2021-06-22 22:18:25 13.11MB CUDA SAR GPU C++
1
适用于NVIDIA11系列的pytorch anaconda环境,完整压缩包,直接解压放置在env文件下即可使用。
2021-06-22 17:27:54 142B pytorch anaconda cuda
1
这个资源请配合原文使用,谢谢http://blog.csdn.net/fishseeker/article/details/75093166
2021-06-22 15:03:46 336KB cuda
1
博客附件 opencv4.3与cuda10.2编译的GPU版本。opencv_dnn调用yolov3 cuda加速都通过了 效果很好,库的依赖做的很干净全部10.2的cuda依赖也带上了 。 这次工程部署可以来说是完美版了。只要是cuda支持10.0上的nvidia显卡完美飞起来。 详细我在博客去讲吧。
2021-06-22 10:10:53 352.52MB opencv cuda gpu 深度学习
1
利用CUDA优化实现图像的锐利化、模糊化。附带整个程序代码,GPU并行计算课程最后的大作业。可以用来参考和借鉴。(代码正确无误,直接复制可跑)
2021-06-22 09:02:00 3.88MB GPU并行计算 CUDA 模糊化 锐利化
1
cudnn-10.0-windows10-x64-v7.4.2.24.zip
2021-06-22 09:00:11 209.84MB cudnn cuda
1
随着网络数据量的暴增与计算机算力的发展,近些年来深度学习领域取得的重大的发展,许多传统机器学习领域无法解决的问题都在深度学习中取得突破。深度卷积神经网络是深度学习中的一中网络结构,与传统的全连接网络相比,采用卷积实现局部连接和权值共享,能够有效的解决参数爆炸的问题,广泛的被应用在计算机视觉领域。然而由于参数训练过程计算量太大,滑动卷积矩阵乘计算非常的费时,完成一个卷积神经网络模型的训练往往需要消耗大量的时间,针对这个问题,本次实验将构建一个基于CUDA架构的编程环境,采用CUDA/C++编程实现二维的卷积的并行计算,通过对比GPU实现与CPU实现,调整不同参数,分析并行技术对程序性能的提升效果
2021-06-22 08:34:56 2KB cuda 卷积
1