MPI CUDA编程.pdf WHAT YOU WILL LEARN What MPI is How to use MPI for inter GPU communication with CUDA and OpenACC What CUDA-aware MPI is What Multi Process Service is and how to use it How to use NVIDIA Tools in an MPI environment How to hide MPI communication times
2022-09-29 15:29:34 3.28MB MPI CUDA 并行计算
1
遗传算法TSP_CUDA 一种遗传算法,可使用CUDA体系结构(GPU)为TSP(旅行商问题)找到最佳解决方案。 这是我在USF进行的并行和分布式处理课程的最后一个项目,与Berkeley在2015年Spring发布的“并行计算机的应用程序”一起完成的。该项目的目的是使自己熟悉遗传算法的设计和实现,重点是学习如何在CUDA架构以及C ++的OpenMP库上编写并行代码。 概述: 该项目将在德克萨斯大学奥斯汀分校的Stampede.tacc超级计算机上运行。 该代码在踩踏群集的单个节点上运行,此刻使用Nvidia的CUDA调用单个GPU。 在CUDA中,执行内核(GPU功能),并由块和线程组成。 每个块最多可以有1024个线程,每个内核可以有〜65000个块。 我设计了一种算法,以便在每个GPU上创建一个填充,该填充由启动内核的NTHREADS * NBLOCKS组成。 例如,在一个流行
2022-09-28 11:57:44 20KB Cuda
1
CUDA-API教程
2022-09-24 09:06:35 2.76MB cuda
1
TensorRT 8.2 GA Update 2 for Windows 10 and CUDA 11.0, 11.1, 11.2, 11.3, 11.4 and 11.5 ZIP Package
2022-09-23 09:01:05 824.25MB tensorrt
1
基于matllab实现的tsne统计算法,在数学建模中效果显著
2022-09-21 22:01:11 82KB tsne tsne算法 统计
TensorRT-8.2.3.0.Windows10.x86_64.cuda-10.2.cudnn8.2.zip为tensorrt开发包
2022-09-20 20:06:15 705.84MB tensorrt
1
win10下搭建Mask Rcnn环境详细教程并运行第一个demo程序(包含Anaconda+Tensorflow-gpu+Cuda+cuDnn安装过程及各种坑)-附件资源
2022-09-20 13:32:38 23B
1
史上最全的pytorch开发环境搭建教程【基于win10】 0.总结 Get to the points first. The article comes from LawsonAbs! pytorch简介 安装前的基本环境 详细安装过程 1.pytorch 是什么? pytorch是一个机器学习的框架平台,与TensorFlow的作用机制相类似。虽然晚于TensorFlow出生,但是凭借其优雅的操作接口和动态图的构建思想,在使用便捷上已经远超TensorFlow,但是因为开放较晚的原因,在工业部署方面仍然在追赶TensorFlow。 2.基本环境 这里我列举我的电脑里 pytorch 的
2022-09-16 14:03:49 177KB c cuda IN
1
k nearest neighbour code implemented on cuda
2022-09-15 09:01:56 34KB k. cuda k_nearest_neighbor
该资源为vs2019下对opencv4.5.1的cuda加速和opencv_contrib4.5.1编译,可以使用opencv的Dnn模块进行深度学习得到的onnx文件进行前向推理以及部署。作者电脑环境为win10,vs2019、i7九代、RTX1650,cuda算力为6.0、6.5、7.0、7.5。下载好打包文件后,直接解压缩,将电脑环境变量配置好即可使用,具体的opencv环境配置可以在网上搜索,配置资源较多。
2022-09-09 16:05:47 485.03MB opencv 深度学习 cuda
1