为设计基于固定序的 Bellman-Ford 算法在 CUDA 平台下并行优化方案,结合算法计算密集和数据密集的特点。从核函数计算层 面,提出了访存优化方法和基于固定序优化线程发散;从 CPU-GPU 传输层面,提出了基于 CUDA 流优化数据传输开销方法。经对不同显 卡测试,参照共享内存容量划分线程块、缩减迭代后向量维度和使用 CUDA 流缩短首次计算时延,相比传统算法,改进后并行算法加速 比在 200 倍左右。该并行优化方案验证了固定序在 CUDA 平台具有可行性和可移植性,可作为多平台研究参照。
1
包含文件:cudart64_101.dll、cublas64_10.dll、cufft64_10.dll、curand64_10.dll 、cusolver64_10.dll 、cusparse64_10.dll 、cudnn64_7.dll 解决以下问题: Could not load dynamic library 'cudart64_101.dll'; dlerror: cudart64_101.dll not found Could not load dynamic library 'cublas64_10.dll'; dlerror: cublas64_10.dll not found Could not load dynamic library 'cufft64_10.dll'; dlerror: cufft64_10.dll not found Could not load dynamic library 'curand64_10.dll'; dlerror: curand64_10.dll not found Could not load dynamic library 'cusolver64_10.dll'; dlerror: cusolver64_10.dll not found Could not load dynamic library 'cusparse64_10.dll'; dlerror: cusparse64_10.dll not found Could not load dynamic library 'cudnn64_7.dll'; dlerror: cudnn64_7.dll not found 将CUDA文件夹里面所有的文件复制放在C:\Windows\System32里面即可。
2021-03-07 18:02:04 436.74MB CUDA TensorF Window10 cudnn
1
CUDA11需要的文件
2021-03-07 15:08:50 163.13MB tensorflow cuda cudnn
1
cuda 11.1,才从官网下下来的 Uploaded by @lbr77 qwq
2021-03-06 15:02:58 466B cuda python
1
opencv+contrib+opengl+cuda
2021-03-05 18:01:32 366.46MB opencv opengl cuda
1
CUDA v11.0可能会缺失的dll动态链接库们.事实上,还是建议同学们缺什么自己去搜着下载,我也已经把大部分解决方案写在文章里了,实在有下载不下来的,再来我这里面找找吧。
2021-03-05 11:19:28 370.61MB dll CUDA v11.0 Tensorflow2.3.0
1
pytorch-1.7.1-py3.8_cuda11.0.221_cudnn8.0.5_0.tar.bz2
2021-03-03 20:00:40 768.46MB pytorch cuda cudnn
1
基于英伟达的jpegNPP工程,分离实现独立的JPEG压缩。
2021-03-03 18:51:35 9KB CUDA JPEG编码
1
1. 文档是从http://cudazone.nvidia.cn/forum/forum.php?mod=viewthread&tid=6266&extra=page=1下载来的,是“yyfn风辰”翻译的文档,原文档是装好cuda sdk后名字为“CUDA_C_Programming_Guide.pdf”的文档 2. 文档上面附有一层斜着的文字,字很大,颜色很深,影响阅读,这里用foxit pdf editer一页一页的把它去掉了,方法比较笨,高手知道更好的方法希望告诉我一下 3. 我看过翻译的文档,很不错,对我这种英语很烂的人非常有帮助
2021-03-03 15:33:04 1.23MB CUDA 编程指南 中文版
1
柯拉兹猜想 它是什么? Collat​​z猜想是一个数学猜想,它涉及一个定义如下的序列:以任何正整数n开头。 然后,从上一项按如下方式获得每个项:如果前一项是偶数,则下一项是前一项的一半。 如果前一项是奇数,则下一项是前一项加3的3倍。推测是,无论n的值是多少,该序列始终会达到1。 前几个序列 该程序的目的 由于该猜想尚未得到现代数学的证明,因此该程序将通过获取现代nvidia gpus的力量来简单地计算非常大的序列的数量。 如果您使用的是基于DebianLinux发行版,则可以使用以下命令安装nvidia的编译器: $ sudo apt install nvidia-cuda-toolkit 然后,您可以通过运行以下命令来编译程序。 $ nvcc -o main collatzConjectureCUDA.cu 最后,您使用来运行程序 ./main Your_Number_Goe
2021-03-03 12:17:33 3KB Cuda
1