matlab运算采用GPU加速的资料,通过matlab和cuda的交互,提升matlab运行的计算速度
2021-12-08 15:25:20 31.47MB matlab gpu cuda
1
网络 简单的介绍 我们正在将传统的几何学和立体声的优化设计成深度神经网络... 口头表达 ,, 建筑要求: gcc: >=5.3 GPU mem: >=6.5G (for testing); >=11G (for training, >=22G is prefered) pytorch: >=1.0 cuda: >=9.2 (9.0 doesn’t support well for the new pytorch version and may have “pybind11 errors”.) tested platform/settings: 1) ubuntu 16.04 + cuda 10.0 + python 3.6, 3.7 2) centos + cuda 9.2 + python 3.7 安装Pytorch: 您可以通过“ pip install”轻松安装pyto
2021-12-08 14:15:33 4.27MB Cuda
1
跑模型时出现RuntimeError: CUDA out of memory.错误 查阅了许多相关内容,原因是:GPU显存内存不够 简单总结一下解决方法: 将batch_size改小。 取torch变量标量值时使用item()属性。 可以在测试阶段添加如下代码: with torch.no_grad(): # 停止自动反向计算梯度 参考: https://wisdomai.xyz/tool/pytorch/archives/2301 https://ptorch.com/news/160.html 作者:菜叶儿掉啦
2021-12-07 23:46:42 27KB c em mem
1
没什么好说的,就是个CentOS的安装教程。老外写的,我觉得比较言简意赅。虚拟机是不能用的。
2021-12-07 16:23:32 207KB CUDA CentOS Linux
1
本文档就cuda和mpi在ubuntu10.10下的安装与配置进行了较为详细的说明,按照此文档安装,ubuntu 10.10下99%会安装正确。通过安装SSH可实现多台机器的无密码访问,并实现cuda+mpi的集群使用。ubuntu下其它版本安装可能稍有不同,但绝大部分是相同的
2021-12-05 20:10:28 29KB ubuntu10.10 cuda mpi ssh
1
oap:CUDA中大型矩阵隐式重启Arnoldi方法的实现和深度学习基础
2021-12-04 09:32:55 2.08MB cuda scientific scientific-computations C++
1
CUDA-quicksort 是一种基于 GPU 的快速排序算法实现。 CUDA-quicksort 旨在利用现代 NVIDIA GPU 的计算能力。 “文献中介绍了两种基于 GPU 的快速排序实现:GPU 快速排序,一种计算统一设备架构 (CUDA) 迭代实现,以及 CUDA 动态并行 (CDP) 快速排序,一种由 NVIDIA 公司提供的递归实现。” [*]。 CUDA-quicksort 是快速排序算法的基于 GPU 的迭代实现。 “在六个排序基准分布上执行的实验表明,CUDA-quicksort 比 GPU-quicksort 快四倍,比 CDP-quicksort 快三倍。”[*]。 *版权所有 :copyright: 2015 John Wiley & Sons, Ltd. Concurrency Computat.: Pract. 专家。 (2015) DOI: 10.1002/cpe.3611 如需更多信息,请参阅相应出版物:http://onlinelibrary.wiley.com/doi/10.1002/cpe.3611/abstract
2021-12-03 21:42:34 2.75MB 开源软件
1
【CUDA并行编程之八】Cuda实现Kmeans算法-附件资源
2021-12-03 21:21:40 23B
1
GPU并行计算与CUDA编程(2017) 视频地址:https://www.bilibili.com/video/av52338886
2021-12-03 19:40:21 83.17MB cuda编程
1
不可多得的CUDA_API中文版教材,赶快下载学习吧
2021-12-02 22:21:06 991KB CUDA
1