串行版本的矩阵乘法 M N P WIDTH WIDTH WIDTH WIDTH // 宿主机的双精度矩阵乘法 void MatrixMulOnHost(float* M, float* N, float* P, int Width){ for (int i = 0; i < Width; ++i) for (int j = 0; j < Width; ++j){ double sum = 0; for (int k = 0; k < Width; ++k){ double a = M[i * width + k]; double b = N[k * width + j]; sum += a * b; } P[i * Width + j] = sum; } } i k k j *
2022-05-25 10:08:57 436KB CUDA
1
NVIDIA 的openCL 教程 介绍了CUDA 和 OpenCL的区别
2022-05-24 19:26:36 271KB NVIDIA OpenCL CUDA GPU
1
一个老程序猿要走Pytorch的新路,先搭建一个运行调试环境,踩坑若干若干,那滋味就是一个字=太爽!分享给同路的小伙伴,一些学习成长吧! 涉及的内容包括: 1.更新显卡驱动GTX1070 CUDA Version:11.6; 2.从官网下载对应版本的 CUDA Toolkit Archive | NVIDIA Developer 3.安装NVIDIA cuDNN 4.安装Anaconda3 5.创建Pytorch_GPU运行的虚拟环境 6.使用清华镜像快速安装PytorchGPU版本 7.IDE安装Pycharm,链接Anaconda环境解释器 8.验证
2022-05-24 09:08:32 535KB pytorch gpu cuda pycharm
1
CUDA是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,CUDA架构能充分发挥GPU的强大计算功能。本书首先介绍了CUDA架构的应用背景,并给出了如何配置CUDA c的开发环境。然后通过矢量求和运算、矢量点积运算、光线跟踪、热传导模拟等示例详细介绍了CUDA c的基本语法和使用模式。通过学习本书,读者可以清楚了解CUDA c中每个功能的适用场合,并编写出高性能的CUDA软件。
2022-05-23 14:31:43 337KB cuda gpu
1
基于cuda的图像边缘检测文档,对于学习cuda的新手来说是不可多得的材料!
2022-05-21 15:15:41 414KB cuda边缘检测
1
Glirt基于CUDA的多模态三维医学图像配准.rar
2022-05-19 11:14:17 3.03MB cuda GPU 并行计算
1
opencv4.5.1+vs2017+win10+cuda+编译
2022-05-18 14:37:25 240.53MB opencv4.5.1 vs2017 win10 cuda
1
简单的MFC对话框调用CUDA函数的应用程序。推荐使用VS2022+CUDA11.6配置。
2022-05-18 14:23:59 135KB CUDA MFC VS2022
1
GPUMD 什么是GPUMD ? GPUMD代表图形处理单元分子动力学。它是在图形处理单元(GPU)上完全实现的通用分子动力学(MD)代码。 通过使用GPU [1],可以大大提高对多体势的力评估[1],这要归功于参考文献中得出的一组简单的力,病毒应力和热流表达式。 [2,3]。 除了高效之外,GPUMD的另一个独特功能是它具有研究热传输的有用工具[2,3,4,5]。 先决条件 您需要具有计算能力不低于3.5的GPU卡以及不低于CUDA 9.0的CUDA工具包。 适用于Linux(带有GCC)和Windows(带有MSVC)操作系统。 编译GPUMD 转到src目录,然后输入make 。编译完成后,将在src目录中生成两个可执行文件gpumd和phonon 。 运行GPUMD 转到目录src 。 键入src/gpumd < examples/input_gpumd.txt来运行exampl
1
TensorRT-8.2.0.6.Windows10.x86_64.cuda-10.2.cudnn8.2 windsows版本,使用的时候将lib include bin中的文件放到对应的你的如C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0路径下的 lib include bin里面
2022-05-16 21:05:46 701.28MB 综合资源
1