QR_CUDA ###使用CGS和MGS的QR分解的GPU实现 这些文件包含用于在GPU上运行Cholesky分解的代码。 它是在安装了CUDA 11.0开发套件的Visual Studio 2019中创建并运行的。 输入矩阵及其尺寸在代码中定义。 在文件QR_CGS.cu中,使用Classical Gram Schmidt算法分解矩阵。 在文件QR_MGS中,使用了改进的Gram Schmidt算法。
2022-01-21 17:09:30 8KB Cuda
1
cuda 11.5.1,需要的朋友可以下载一下,百度云下载
2022-01-19 16:09:16 97B cuda
1
适用于NVIDIA和AMD GPU的GPU内存测试实用程序,使用来自memtest86 / memtest86 +的完善模式以及其他压力测试。 测试旨在发现硬件和软件错误。 该代码是用CUDA和OpenCL编写的。
2022-01-18 19:56:21 167KB 开源软件
1
为了让CUDA的关键字,如__device__、dim3之类的文字高亮,需要如下步骤: 把SDK_PATH\C\doc\syntax_highlighting\usertype.dat 复制到X:\Program Files (X86)\Microsoft Visual Studio 10.0\Common7\IDE\目录下 这里 X:是安装VS2010盘符,这是win7 64位下的路径。 注意:win7 64系统不要复制到这个目录里,复制到这里是不会CUDA关键字高亮的: X:\Program Files \Microsoft Visual Studio 10.0\Common7\IDE\ (如果你的win7是32位的,可能正好是上面这个目录,应该会高亮的,这是win7 64位和32位的差别) 再次强调:SDK_PATH要换成你安装SDK的实际路径,不要直接使用这个字符串。 VS2010需要重启,重启后打开.cu文件,CUDA的关键字应该变成蓝色了。
2022-01-18 17:40:35 1KB cuda cu highlight 高亮显示
1
cudnn64_7.dll
2022-01-17 14:00:25 368.31MB GPU CUDNN CUDA NVIDIA
1
cudnn8 适配cuda11.1 11.0
2022-01-16 17:05:22 309.1MB CUDA11 CUDA cudnn8
多点路径规划指标cuOMT:自适应蒙特卡洛最优传输算法的CUDA / C ++实现 这项工作是根据许可的。 该存储库包含cuOMT ,这是一个使用自适应蒙特卡洛最优传输(MC-OT)算法的CUDA / C ++求解器。 请参阅以获取PyTorch实施。 大创意 自适应MC-OT算法旨在通过解决凸优化问题来解决高维最优运输问题。 基本上,在给定源分布和目标分布的情况下,最佳运输问题是找到最佳运输计划,以将源分布上的质量移动到目标分布。 例如,假设源分布由每个面包店制作的面包量组成,目标分布由每个咖啡馆所需要的面包量组成。 面包店和咖啡馆位于不同的地方,将面包从一个地点转移到另一个地点需要支付运输费用。 然后,最佳的运输问题是找到一种将面包从面包店运到咖啡馆的运输计划,从而使总运输成本降至最低。 每当需要找到将分配转换为另一种的“良好”映射(即OT映射)时,就会出现最佳传输问题。 例如,在深度学习领域,生成模型被设计为无限生成与给定数据集中的样本相似的许多样本。 如果我们将数据集的样本作为潜在分布(可能是高维)的iid采样,则通过在已知分布(例如均匀)和该潜在分布之间进行OT映射,首先可以
2022-01-14 01:29:31 25.33MB 系统开源
1
ubuntu20.04下编译cuda,采用Qt的实例代码
2022-01-12 22:02:32 1KB cuda qt
1
深度学习-环境配置一、Linux1. CPU2. GPU二、macOS1. CPU2. GPU三、Windows1. CPU2. GPU四、下载网址 一、Linux Tested build configurations Linux 1. CPU 2. GPU 二、macOS 1. CPU 2. GPU 三、Windows 1. CPU 2. GPU 四、下载网址 CUDA 下载地址 点击打开链接 cudnn 下载地址 需要注册账号 https://developer.nvidia.com/cudnn tensorflow-cpu 下载地址 阿里镜像,下载速度快 http://mi
2022-01-12 21:28:44 284KB cuda cudnn dn
1
VS2019编译的opencv-4.2.0+contrib-4.2.0,支持CUDA,DNN功能。GPU显卡的Compute Capability需>=5.3 编译所用的工具及环境: Cmake-3.17.5 VS2019 opencv-4.2.0 opencv-contrib-4.2.0 cuda-10.1 cudnn-7.6.2 tbb2019_20190206oss_win python-3.6 numpy-1.15
2022-01-12 19:33:45 343.3MB vs2019 cuda opencv opencv-contrib
1