搜索【CUDA】的结果

cuda8.0+cudnn6.0+python3.5+pip_for_win10亲测可用，救急

内含cuda8.0、cudnn6.0、python3.5以及安装教程，win10亲测可用，由于文件大于110M，故上传百度云链接，大家下载下来的是百度云分享链接和密码，然后再用百度云下载即可

2023-03-21 18:08:36 58B cuda cudnn python3.5

1

pytorch-loss:标签平滑，amsoftmax，散焦，三重损失，lovasz-softmax。也许有用

火炬损失我实现的标签平滑，amsoftmax，焦点损耗，双焦点损耗，三重态损耗，giou损耗，亲和力损耗，pc_softmax_cross_entropy，ohem损耗（基于行硬挖掘损失的softmax），大利润- softmax（bmvc2019），lovasz-softmax-loss和dice-loss（广义的软骰子损失和批处理软骰子损失）。也许这对我的未来工作很有用。还尝试实现swish，hard-swish（hswish）和mish激活功能。此外，添加了基于cuda的一键式功能（支持标签平滑）。新添加一个“指数移动平均线（EMA）”运算符。添加卷积运算，例如coord-conv2d和dynamic-conv2d（dy-conv2d）。一些运算符是使用pytorch cuda扩展实现的，因此您需要先对其进行编译： $ python setup.py

2023-03-21 11:04:16 93KB cuda pytorch ema triplet-loss

1

深入浅出谈CUDA.pdf

GPU优缺点，对CUDA架构，执行的模式，下载安装以及CUDA实例代码的讲解及利用CUDA进行运算怎样提高带宽及速率优化的分析与方法。

2023-03-21 10:52:22 306KB CUDA

1

cuda10.2+cudnn-10.2.zip

2023-03-18 13:52:54 295.68MB cuda cudnn

1

cuda检测工具 devicequery.exe

deviceQuery.exe Starting... CUDA Device Query (Runtime API) version (CUDART static linking) Detected 1 CUDA Capable device(s) Device 0: "GeForce GTX 650" CUDA Driver Version / Runtime Version 9.1 / 8.0 CUDA Capability Major/Minor version number: 3.0 Total amount of global memory: 2048 MBytes (2147483648 bytes) ( 2) Multiprocessors, (192) CUDA Cores/MP: 384 CUDA Cores GPU Max Clock rate: 1072 MHz (1.07 GHz) Memory Clock rate: 2500 Mhz Memory Bus Width: 128-bit L2 Cache Size: 262144 bytes Maximum Texture Dimension Size (x,y,z) 1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096) Maximum Layered 1D Texture Size, (num) layers 1D=(16384), 2048 layers Maximum Layered 2D Texture Size, (num) layers 2D=(16384, 16384), 2048 layers Total amount of constant memory: 65536 bytes Total amount of shared memory per block: 49152 bytes Total number of registers available per block: 65536 Warp size: 32 Maximum number of threads per multiprocessor: 2048 Maximum number of threads per block: 1024 Max dimension size of a thread block (x,y,z): (1024, 1024, 64) Max dimension size of a grid size (x,y,z): (2147483647, 65535, 65535) Maximum memory pitch: 2147483647 bytes Texture alignment: 512 bytes Concurrent copy and kernel execution: Yes with 1 copy engine(s) Run time limit on kernels: Yes Integrated GPU sharing Host Memory: No Support host page-locked memory mapping: Yes Alignment requirement for Surfaces: Yes Device has ECC support: Disabled CUDA Device Driver Mode (TCC or WDDM): WDDM (Windows Display Driver Model) Device supports Unified Addressing (UVA): Yes Device PCI Domain ID / Bus ID / location ID: 0 / 1 / 0 Compute Mode: < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) > deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 9.1, CUDA Runtime Version = 8.0, NumDevs = 1, Device0 = GeForce GTX 650 Result = PASS

2023-03-16 11:23:46 980KB cuda

1

cudart64_101.dll

cudart64_101.dll tensorflow运行时报错cudart64_101.dll文件无法打开将该文件复制到cuda安装文件夹bin下

2023-03-15 09:16:59 133KB tensorflow cuda

1

Windows下编译好的可执行exe:COLMAP-3.7-windows-cuda.zip

如果有gpu ，可下载cuda版本的, 直接使用Windows下编译好的可执行exe:COLMAP-3.7-windows-cuda.zip

2023-03-13 20:39:54 128.71MB colmap3.7

1

jcuda:JCuda-CUDA的Java绑定

杰库达 JCuda-CUDA的Java绑定有关更多信息和构建说明，请参考。

2023-03-11 16:22:28 611KB java gpu cuda Java

1

GPU 高性能运算之CUDA

CUDA入门必备的书籍想学CUDA的必看哦中文的书学习来相对容易点

2023-03-10 15:42:34 14.3MB GPU CUDA 高性能计算

1

通过 CUDA 实现高斯混合模型的期望最大化：CUDA 为高斯混合模型启用了并行 EM，提供超过 100 倍的性能提升。-matlab开发

这是多维高斯混合模型的期望最大化算法的并行实现，旨在在 NVidia 显卡上运行，支持CUDA。在我的机器上，它提供高达 170 倍的性能提升（16 个暗淡、16 个集群、1000000 个数据点）。有关更多信息，请参阅http://andrewharp.com/gmmcuda 上提供的报告。有趣的代码都在 gpugaumixmod.h 和 gpugaumixmod_kernel.h 中。参考 CPU 实现位于 cpuaumixmod.h 中。它可以集成到支持 CUDA 的系统上的任何 C 程序中。此外，在 gmm.cu 中提供了 Matlab 集成。自最初发布以来，我添加了同步随机重启。实验 1 现在利用了这一点。编译================================================== ====================

2023-03-09 17:44:44 127KB matlab

1

个人信息

热门下载

最新下载

其他资源