CUDA PTX 手册
2022-01-23 19:12:49 3.74MB CUDA ptx GPU 高性能计算
1
中文书名:《大规模并行处理器编程实战》,胡文美的书,很好的学习cuda的书。《大规模并行处理器编程实战》介绍了学生和专业人员都适合的并行编程与gpu体系结构的基本概念,详细剖析了编写并行程序所需的各种技术,用案例研究说明了并行程序设计的整个开发过程,即从计算思想开始,直到最终实现高效可行的并行程序。
2022-01-22 21:48:49 7.77MB GPU cuda
1
CUDA-Cpp-Makefile 大型 CUDA C++ 程序的 Makefile 原型 混合使用 CUDA 和 C++ 源文件的程序很难使用 Make 进行管理。 nvcc 要求文件以 .o 后缀结尾才能进行链接,但以 .o 结尾的 Makefile 规则会覆盖现有的隐式规则,从而导致烦人的循环依赖消息。 此外,nvcc 编译器速度慢,特别是对于大型项目的编译。 因此,重新编译所有 CUDA 源文件即使只有一小部分更改的解决方案是不够的。 这个简单的 Makefile 会自动处理这些烦恼。 输入: 包含 C++ 和 CUDA 源文件和(可选)CUDA 头文件的目录 C++ 和 CUDA 包含目录 g++ 和 nvcc 编译器标志(如果需要,可以轻松调整 Clang) (可选)调试上述等效项 输出: 代码的编译和链接的可执行文件 源文件是分开处理的——编辑一个文件只需要重新编
2022-01-21 20:38:22 2KB Makefile
1
QR_CUDA ###使用CGS和MGS的QR分解的GPU实现 这些文件包含用于在GPU上运行Cholesky分解的代码。 它是在安装了CUDA 11.0开发套件的Visual Studio 2019中创建并运行的。 输入矩阵及其尺寸在代码中定义。 在文件QR_CGS.cu中,使用Classical Gram Schmidt算法分解矩阵。 在文件QR_MGS中,使用了改进的Gram Schmidt算法。
2022-01-21 17:09:30 8KB Cuda
1
cuda 11.5.1,需要的朋友可以下载一下,百度云下载
2022-01-19 16:09:16 97B cuda
1
适用于NVIDIA和AMD GPU的GPU内存测试实用程序,使用来自memtest86 / memtest86 +的完善模式以及其他压力测试。 测试旨在发现硬件和软件错误。 该代码是用CUDA和OpenCL编写的。
2022-01-18 19:56:21 167KB 开源软件
1
为了让CUDA的关键字,如__device__、dim3之类的文字高亮,需要如下步骤: 把SDK_PATH\C\doc\syntax_highlighting\usertype.dat 复制到X:\Program Files (X86)\Microsoft Visual Studio 10.0\Common7\IDE\目录下 这里 X:是安装VS2010盘符,这是win7 64位下的路径。 注意:win7 64系统不要复制到这个目录里,复制到这里是不会CUDA关键字高亮的: X:\Program Files \Microsoft Visual Studio 10.0\Common7\IDE\ (如果你的win7是32位的,可能正好是上面这个目录,应该会高亮的,这是win7 64位和32位的差别) 再次强调:SDK_PATH要换成你安装SDK的实际路径,不要直接使用这个字符串。 VS2010需要重启,重启后打开.cu文件,CUDA的关键字应该变成蓝色了。
2022-01-18 17:40:35 1KB cuda cu highlight 高亮显示
1
cudnn64_7.dll
2022-01-17 14:00:25 368.31MB GPU CUDNN CUDA NVIDIA
1
cudnn8 适配cuda11.1 11.0
2022-01-16 17:05:22 309.1MB CUDA11 CUDA cudnn8
多点路径规划指标cuOMT:自适应蒙特卡洛最优传输算法的CUDA / C ++实现 这项工作是根据许可的。 该存储库包含cuOMT ,这是一个使用自适应蒙特卡洛最优传输(MC-OT)算法的CUDA / C ++求解器。 请参阅以获取PyTorch实施。 大创意 自适应MC-OT算法旨在通过解决凸优化问题来解决高维最优运输问题。 基本上,在给定源分布和目标分布的情况下,最佳运输问题是找到最佳运输计划,以将源分布上的质量移动到目标分布。 例如,假设源分布由每个面包店制作的面包量组成,目标分布由每个咖啡馆所需要的面包量组成。 面包店和咖啡馆位于不同的地方,将面包从一个地点转移到另一个地点需要支付运输费用。 然后,最佳的运输问题是找到一种将面包从面包店运到咖啡馆的运输计划,从而使总运输成本降至最低。 每当需要找到将分配转换为另一种的“良好”映射(即OT映射)时,就会出现最佳传输问题。 例如,在深度学习领域,生成模型被设计为无限生成与给定数据集中的样本相似的许多样本。 如果我们将数据集的样本作为潜在分布(可能是高维)的iid采样,则通过在已知分布(例如均匀)和该潜在分布之间进行OT映射,首先可以
2022-01-14 01:29:31 25.33MB 系统开源
1