这两个例子程序都是已经调试好的,大家可以直接编译运行了。配置好VS之后就可以运行了
2021-08-26 11:25:29 3KB CUDA
1
信息 作为硕士论文的一部分,对C ++中实现的顺序排序算法与CUDA中实现的并行排序算法之间的比较进行了研究。 我们实现了七个算法:双音排序,多步双音排序,自适应双音排序,合并排序,快速排序,基数排序和样本排序。 顺序算法是在使用C ++的CPU上实现的,而并行算法是在使用CUDA平台的GPU上实现的。 我们改进了上述实现,并采用了它们,以便能够对任意长度的输入序列进行排序。 我们在六个不同的输入分布上比较了算法,这些分布包括32位数字,32位键值对,64位数字和64位键值对。 结果表明,基数排序是最快的顺序排序算法,而基数排序和合并排序是最快的并行排序算法(取决于输入分布)。 与顺序实现相比,通过并行实现,我们最多可实现157倍的加速。 作者:DarkoBožidar 导师:TomažDobravec博士 资料下载 结果: : 硕士学位论文(斯洛文尼亚版) : : usp
2021-08-26 10:15:00 123KB C++
1
CUDA NVIDIA官方手册中文版 通过GPU进行并行计算的朋友不可不看 各种CUDA命令的解释及用法
2021-08-26 10:06:05 873KB CUDA
1
GPU的cuda中文开发文档,适合于刚入门的初学者学习,
2021-08-26 09:50:19 2.13MB CUDA GPU
1
有限差分方法求解Poisson方程代码。包括四个主要函数:5、测试平台下的所有OpenCL设备,现实主要性能和参数;2、测试CPU计算效率;3、测试OpenCL C 在GPU上的运行效率;4、测试OpenCL C++在GPU上的运行效率;5、测试CUDA在GPU上的运行效率。 代码相当简单,可以用来简单测试计算平台的性能,也可作为CUDA和OpenCL的入门参考程序。
2021-08-26 08:48:50 28KB OpenCL CUDA CFD
1
cudaa for ubuntu 20.4
2021-08-25 14:11:21 435.34MB cudnn gpu cuda nvidia
1
使用CUDA编程实现并行粒子群优化算法,主要运算部分在GPU上实现,CPU实现逻辑控制。并行计算比串行块10倍多,速度快,精度高。
2021-08-25 09:13:20 7KB cuda c++ 并行计算 粒子群算法
1
简要介绍异构并行计算业界发展现状及MIC、CUDA编译技术的使用
2021-08-24 14:28:35 5.35MB 异构并行计算
1
TensorRT-7.0.0.11.Windows10.x86_64.cuda-10.0.cudnn7.6.zip 下载
2021-08-24 09:23:27 390.72MB TensorRT-YOLOv5
1
TensorRT-7.0.0.11.Ubuntu-16.04.x86_64-gnu.cuda-10.2.cudnn7.6.tar.gz 下载
2021-08-24 09:23:27 731.08MB TensorRT-YOLOv5
1