文章《(来点有用的)MATLAB+C+CUDA混合编程》的测试代码
2021-04-02 15:58:21 2KB MATLAB C\C++ CUDA 混合编
1
TensorFlow-CUDA-cuDNN版本配套关系表,还有python版本,compiler版本,build tools版本等对应。
2021-03-31 21:18:10 16KB TensorFlow CUDA cuDNN TensorFlow-CUDA-
1
CUDA实现的可行变卷积
2021-03-31 20:22:04 24KB 卷积
1
cuda安装版本出现问题的时候,可能会出现importerror: libcublas.so.10.0: cannot open shared object file: No such file or directory的错误,根本原因三cuda下找不到这个文件,把这个文件放到/usr/local/cuda/lib64文件夹下即可。
2021-03-31 13:38:59 67.53MB 人工智能 cuda
1
uBlock密码算法SSE实现与GPU实现的比较,GPU使用的是单个流实现, GPU为rtx1650,cput是r7000, GPU的性能是SSE实现的两倍
2021-03-31 09:00:39 48.99MB SSE指令集 uBlock密码算法 CUDA编程
1
使用CUDA计算的加速实例:生成N个服从正态分布的随机数,包含了线程索引,grid/block划分,计算时间统计等要素。 包含两个.cu文件,normal_cpu仅使用cpu计算,计算结果耗时5s左右;normal_gpu使用GPU计算,计算结果耗时3ms左右。不同的计算卡可能有所不同,初级实例,仅供初学者参考。
2021-03-30 21:31:58 3KB CUDA normal gpu 正态分布
1
基于CUDA的GPU并行,给出了三种不同的前缀求和算法,第一种是基本的规约并行算法,第二种是采用共享内存优化的GPU并行算法,第三种是采用trust库的前缀求和函数。并且给出了三种方法对比之间的性能差异
2021-03-29 11:00:50 3KB CUDA Prefix Sum 前缀求和
1
通过归并的思想,利用nvidia的cuda工具,对求和的算法进行gpu并行计算操作,使得求和的效率大大提高。
2021-03-29 10:05:20 2KB cuda
1
nvcuda(64位)适合在图像识别win10系统文件夹system32下放置,显卡一般为英伟达卡。
2021-03-28 13:36:06 10.49MB 图像识别 nvcuda cuda
1
cudnn8.1.1_Ubuntu18_04_deb直接下载。去nvidia官网下载需要注册,还要填一张调查问卷才能下载
2021-03-27 20:34:01 399B cudnn cuda
1