GPU优缺点,对CUDA架构,执行的模式,下载安装以及CUDA实例代码的讲解及利用CUDA进行运算怎样提高带宽及速率优化的分析与方法。
2023-03-21 10:52:22 306KB CUDA
1
cuda10.2+cudnn-10.2.zip
2023-03-18 13:52:54 295.68MB cuda cudnn
1
deviceQuery.exe Starting... CUDA Device Query (Runtime API) version (CUDART static linking) Detected 1 CUDA Capable device(s) Device 0: "GeForce GTX 650" CUDA Driver Version / Runtime Version 9.1 / 8.0 CUDA Capability Major/Minor version number: 3.0 Total amount of global memory: 2048 MBytes (2147483648 bytes) ( 2) Multiprocessors, (192) CUDA Cores/MP: 384 CUDA Cores GPU Max Clock rate: 1072 MHz (1.07 GHz) Memory Clock rate: 2500 Mhz Memory Bus Width: 128-bit L2 Cache Size: 262144 bytes Maximum Texture Dimension Size (x,y,z) 1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096) Maximum Layered 1D Texture Size, (num) layers 1D=(16384), 2048 layers Maximum Layered 2D Texture Size, (num) layers 2D=(16384, 16384), 2048 layers Total amount of constant memory: 65536 bytes Total amount of shared memory per block: 49152 bytes Total number of registers available per block: 65536 Warp size: 32 Maximum number of threads per multiprocessor: 2048 Maximum number of threads per block: 1024 Max dimension size of a thread block (x,y,z): (1024, 1024, 64) Max dimension size of a grid size (x,y,z): (2147483647, 65535, 65535) Maximum memory pitch: 2147483647 bytes Texture alignment: 512 bytes Concurrent copy and kernel execution: Yes with 1 copy engine(s) Run time limit on kernels: Yes Integrated GPU sharing Host Memory: No Support host page-locked memory mapping: Yes Alignment requirement for Surfaces: Yes Device has ECC support: Disabled CUDA Device Driver Mode (TCC or WDDM): WDDM (Windows Display Driver Model) Device supports Unified Addressing (UVA): Yes Device PCI Domain ID / Bus ID / location ID: 0 / 1 / 0 Compute Mode: < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) > deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 9.1, CUDA Runtime Version = 8.0, NumDevs = 1, Device0 = GeForce GTX 650 Result = PASS
2023-03-16 11:23:46 980KB cuda
1
cudart64_101.dll tensorflow运行时报错cudart64_101.dll文件无法打开 将该文件复制到cuda安装文件夹bin下
2023-03-15 09:16:59 133KB tensorflow cuda
1
如果有gpu ,可下载cuda版本的, 直接使用Windows下编译好的可执行exe:COLMAP-3.7-windows-cuda.zip
2023-03-13 20:39:54 128.71MB colmap3.7
1
杰库达 JCuda-CUDA的Java绑定 有关更多信息和构建说明,请参考 。
2023-03-11 16:22:28 611KB java gpu cuda Java
1
CUDA入门必备的书籍 想学CUDA的必看哦 中文的书学习来相对容易点
2023-03-10 15:42:34 14.3MB GPU CUDA 高性能计算
1
这是多维高斯混合模型的期望最大化算法的并行实现,旨在在 NVidia 显卡上运行,支持CUDA。 在我的机器上,它提供高达 170 倍的性能提升(16 个暗淡、16 个集群、1000000 个数据点)。 有关更多信息,请参阅http://andrewharp.com/gmmcuda 上提供的报告。 有趣的代码都在 gpugaumixmod.h 和 gpugaumixmod_kernel.h 中。 参考 CPU 实现位于 cpuaumixmod.h 中。 它可以集成到支持 CUDA 的系统上的任何 C 程序中。 此外,在 gmm.cu 中提供了 Matlab 集成。 自最初发布以来,我添加了同步随机重启。 实验 1 现在利用了这一点。 编译================================================== ====================
2023-03-09 17:44:44 127KB matlab
1
包括4点: 1、安装Anaconda 2、安装CUDA 3、安装PyTorch 4、安装PyCharm 本次由于选择的PyTorch是1.4版本,支持的是CUDA10.1,所以CUDA安装的版本是10.1。 一、安装Anaconda 1、win10 Anaconda官网 https://www.anaconda.com/distribution/ 如下图,选择 根据自己的电脑位数进行选择,下载后安装即可。注意一点 需要勾选这两个选项。 确认安装成功:打开CMD,输入 conda list 如果出现内容,则代表安装成功。 2、Ubuntu 也打开官网,点击相应版本进行下载,下载后安装即可。
2023-03-09 13:52:56 762KB ar arm bu
1
windows10下cuda11.0.1版本的网络安装可执行文件
2023-03-08 20:37:37 56.5MB cuda11.0.1 win10 network
1