内含cuda8.0、cudnn6.0、python3.5以及安装教程,win10亲测可用,由于文件大于110M,故上传百度云链接,大家下载下来的是百度云分享链接和密码,然后再用百度云下载即可
2023-03-21 18:08:36 58B cuda cudnn python3.5
1
火炬损失 我实现的标签平滑,amsoftmax,焦点损耗,双焦点损耗,三重态损耗,giou损耗,亲和力损耗,pc_softmax_cross_entropy,ohem损耗(基于行硬挖掘损失的softmax),大利润- softmax(bmvc2019),lovasz-softmax-loss和dice-loss(广义的软骰子损失和批处理软骰子损失)。 也许这对我的未来工作很有用。 还尝试实现swish,hard-swish(hswish)和mish激活功能。 此外,添加了基于cuda的一键式功能(支持标签平滑)。 新添加一个“指数移动平均线(EMA)”运算符。 添加卷积运算,例如coord-conv2d和dynamic-conv2d(dy-conv2d)。 一些运算符是使用pytorch cuda扩展实现的,因此您需要先对其进行编译: $ python setup.py
2023-03-21 11:04:16 93KB cuda pytorch ema triplet-loss
1
GPU优缺点,对CUDA架构,执行的模式,下载安装以及CUDA实例代码的讲解及利用CUDA进行运算怎样提高带宽及速率优化的分析与方法。
2023-03-21 10:52:22 306KB CUDA
1
cuda10.2+cudnn-10.2.zip
2023-03-18 13:52:54 295.68MB cuda cudnn
1
deviceQuery.exe Starting... CUDA Device Query (Runtime API) version (CUDART static linking) Detected 1 CUDA Capable device(s) Device 0: "GeForce GTX 650" CUDA Driver Version / Runtime Version 9.1 / 8.0 CUDA Capability Major/Minor version number: 3.0 Total amount of global memory: 2048 MBytes (2147483648 bytes) ( 2) Multiprocessors, (192) CUDA Cores/MP: 384 CUDA Cores GPU Max Clock rate: 1072 MHz (1.07 GHz) Memory Clock rate: 2500 Mhz Memory Bus Width: 128-bit L2 Cache Size: 262144 bytes Maximum Texture Dimension Size (x,y,z) 1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096) Maximum Layered 1D Texture Size, (num) layers 1D=(16384), 2048 layers Maximum Layered 2D Texture Size, (num) layers 2D=(16384, 16384), 2048 layers Total amount of constant memory: 65536 bytes Total amount of shared memory per block: 49152 bytes Total number of registers available per block: 65536 Warp size: 32 Maximum number of threads per multiprocessor: 2048 Maximum number of threads per block: 1024 Max dimension size of a thread block (x,y,z): (1024, 1024, 64) Max dimension size of a grid size (x,y,z): (2147483647, 65535, 65535) Maximum memory pitch: 2147483647 bytes Texture alignment: 512 bytes Concurrent copy and kernel execution: Yes with 1 copy engine(s) Run time limit on kernels: Yes Integrated GPU sharing Host Memory: No Support host page-locked memory mapping: Yes Alignment requirement for Surfaces: Yes Device has ECC support: Disabled CUDA Device Driver Mode (TCC or WDDM): WDDM (Windows Display Driver Model) Device supports Unified Addressing (UVA): Yes Device PCI Domain ID / Bus ID / location ID: 0 / 1 / 0 Compute Mode: < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) > deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 9.1, CUDA Runtime Version = 8.0, NumDevs = 1, Device0 = GeForce GTX 650 Result = PASS
2023-03-16 11:23:46 980KB cuda
1
cudart64_101.dll tensorflow运行时报错cudart64_101.dll文件无法打开 将该文件复制到cuda安装文件夹bin下
2023-03-15 09:16:59 133KB tensorflow cuda
1
如果有gpu ,可下载cuda版本的, 直接使用Windows下编译好的可执行exe:COLMAP-3.7-windows-cuda.zip
2023-03-13 20:39:54 128.71MB colmap3.7
1
杰库达 JCuda-CUDA的Java绑定 有关更多信息和构建说明,请参考 。
2023-03-11 16:22:28 611KB java gpu cuda Java
1
CUDA入门必备的书籍 想学CUDA的必看哦 中文的书学习来相对容易点
2023-03-10 15:42:34 14.3MB GPU CUDA 高性能计算
1
这是多维高斯混合模型的期望最大化算法的并行实现,旨在在 NVidia 显卡上运行,支持CUDA。 在我的机器上,它提供高达 170 倍的性能提升(16 个暗淡、16 个集群、1000000 个数据点)。 有关更多信息,请参阅http://andrewharp.com/gmmcuda 上提供的报告。 有趣的代码都在 gpugaumixmod.h 和 gpugaumixmod_kernel.h 中。 参考 CPU 实现位于 cpuaumixmod.h 中。 它可以集成到支持 CUDA 的系统上的任何 C 程序中。 此外,在 gmm.cu 中提供了 Matlab 集成。 自最初发布以来,我添加了同步随机重启。 实验 1 现在利用了这一点。 编译================================================== ====================
2023-03-09 17:44:44 127KB matlab
1