搜索【CUDA.】的结果

ptx_isa_7.1.pdf

CUDA PTX 手册

2022-01-23 19:12:49 3.74MB CUDA ptx GPU 高性能计算

1

Programming Massively Parallel__ Processors

中文书名：《大规模并行处理器编程实战》，胡文美的书，很好的学习cuda的书。《大规模并行处理器编程实战》介绍了学生和专业人员都适合的并行编程与gpu体系结构的基本概念，详细剖析了编写并行程序所需的各种技术，用案例研究说明了并行程序设计的整个开发过程，即从计算思想开始，直到最终实现高效可行的并行程序。

2022-01-22 21:48:49 7.77MB GPU cuda

1

CUDA-Cpp-Makefile:大型 CUDA C++ 程序的 Makefile-源码

CUDA-Cpp-Makefile 大型 CUDA C++ 程序的 Makefile 原型混合使用 CUDA 和 C++ 源文件的程序很难使用 Make 进行管理。 nvcc 要求文件以 .o 后缀结尾才能进行链接，但以 .o 结尾的 Makefile 规则会覆盖现有的隐式规则，从而导致烦人的循环依赖消息。此外，nvcc 编译器速度慢，特别是对于大型项目的编译。因此，重新编译所有 CUDA 源文件即使只有一小部分更改的解决方案是不够的。这个简单的 Makefile 会自动处理这些烦恼。输入：包含 C++ 和 CUDA 源文件和（可选）CUDA 头文件的目录 C++ 和 CUDA 包含目录 g++ 和 nvcc 编译器标志（如果需要，可以轻松调整 Clang）（可选）调试上述等效项输出：代码的编译和链接的可执行文件源文件是分开处理的——编辑一个文件只需要重新编

2022-01-21 20:38:22 2KB Makefile

1

QR_CUDA：QR分解的GPU实现-源码

QR_CUDA ###使用CGS和MGS的QR分解的GPU实现这些文件包含用于在GPU上运行Cholesky分解的代码。它是在安装了CUDA 11.0开发套件的Visual Studio 2019中创建并运行的。输入矩阵及其尺寸在代码中定义。在文件QR_CGS.cu中，使用Classical Gram Schmidt算法分解矩阵。在文件QR_MGS中，使用了改进的Gram Schmidt算法。

2022-01-21 17:09:30 8KB Cuda

1

【CUDA 11.5.1 for Windows11】

cuda 11.5.1，需要的朋友可以下载一下，百度云下载

2022-01-19 16:09:16 97B cuda

1

CUDA GPU memtest-开源

适用于NVIDIA和AMD GPU的GPU内存测试实用程序，使用来自memtest86 / memtest86 +的完善模式以及其他压力测试。测试旨在发现硬件和软件错误。该代码是用CUDA和OpenCL编写的。

2022-01-18 19:56:21 167KB 开源软件

1

usertype.dat

为了让CUDA的关键字，如__device__、dim3之类的文字高亮，需要如下步骤：把SDK_PATH\C\doc\syntax_highlighting\usertype.dat 复制到X:\Program Files (X86)\Microsoft Visual Studio 10.0\Common7\IDE\目录下这里 X:是安装VS2010盘符，这是win7 64位下的路径。注意：win7 64系统不要复制到这个目录里，复制到这里是不会CUDA关键字高亮的： X:\Program Files \Microsoft Visual Studio 10.0\Common7\IDE\ （如果你的win7是32位的，可能正好是上面这个目录，应该会高亮的，这是win7 64位和32位的差别）再次强调：SDK_PATH要换成你安装SDK的实际路径，不要直接使用这个字符串。 VS2010需要重启，重启后打开.cu文件，CUDA的关键字应该变成蓝色了。

2022-01-18 17:40:35 1KB cuda cu highlight 高亮显示

1

cudnn64_7.dll

2022-01-17 14:00:25 368.31MB GPU CUDNN CUDA NVIDIA

1

cudnn8 适配cuda11.1 11.0

2022-01-16 17:05:22 309.1MB CUDA11 CUDA cudnn8

多点路径规划matlab代码-cuOMT:自适应蒙特卡洛最优输运算法的CUDA/C++实现

多点路径规划指标cuOMT：自适应蒙特卡洛最优传输算法的CUDA / C ++实现这项工作是根据许可的。该存储库包含cuOMT ，这是一个使用自适应蒙特卡洛最优传输（MC-OT）算法的CUDA / C ++求解器。请参阅以获取PyTorch实施。大创意自适应MC-OT算法旨在通过解决凸优化问题来解决高维最优运输问题。基本上，在给定源分布和目标分布的情况下，最佳运输问题是找到最佳运输计划，以将源分布上的质量移动到目标分布。例如，假设源分布由每个面包店制作的面包量组成，目标分布由每个咖啡馆所需要的面包量组成。面包店和咖啡馆位于不同的地方，将面包从一个地点转移到另一个地点需要支付运输费用。然后，最佳的运输问题是找到一种将面包从面包店运到咖啡馆的运输计划，从而使总运输成本降至最低。每当需要找到将分配转换为另一种的“良好”映射（即OT映射）时，就会出现最佳传输问题。例如，在深度学习领域，生成模型被设计为无限生成与给定数据集中的样本相似的许多样本。如果我们将数据集的样本作为潜在分布（可能是高维）的iid采样，则通过在已知分布（例如均匀）和该潜在分布之间进行OT映射，首先可以

2022-01-14 01:29:31 25.33MB 系统开源

1

个人信息

热门下载

最新下载

其他资源