Tensorflow自定义操作员代码大纲生成器 编写张量流运算符需要编写大量的样板C ++和CUDA代码。 该脚本为Tensorflow运算符的CPU和GPU版本生成代码。 更具体地,给定的tensorflow inputs , outputs和attribute s时,产生: C ++头文件,该文件定义操作符类,以Device为模板。 定义操作员的CPU实现的C ++头文件。 具有Shape函数,REGISTER_OP和REGISTER_KERNEL_BUILDER构造的C ++源文件。 Cuda标头,用于定义操作员的GPU实现,包括CUDA内核。 Cuda源文件,带有GPU REGISTER_KERNEL_BUILDER供操作员使用。 python单元测试用例,它构造随机输入数据,并调用运算符。 Makefile,用于使用g ++和nvcc将运算符编译为共享库。 要求
2022-07-19 22:42:45 19KB python code-generator tensorflow Python
1
提供了cuda和非cuda的版本,大家可以直接调用
2022-07-15 22:05:07 7KB cuda 欧式聚类
1
CUDA并行程序设计 GPU编程指南-中文英文高清完整版(各500+页)
2022-07-15 18:05:51 130.54MB gpu
1
cudnn-11.3-windows-x64-v8.2.1.32.rar cudnn的rar解压后相关内容复制进cuda安装的NVIDIA GPU Computing Toolkit/CUDA/v11.3文件夹中 cuda太大传不上,去官网选择相应版本下载cuda_11.3.0_465.89_win10.exe
2022-07-15 17:06:04 456.01MB cuda cudnn 深度学习 gpu
1
jetson-utils 适用于NVIDIA Jetson TX1 / TX2的C / C ++包装Linux实用程序-相机,编解码器,HID,GStreamer,CUDA,OpenGL / XGL
2022-07-15 10:39:07 600KB C++
1
深度学习无法使用GPU:解决深度学习使用gpu错误could not load library cudnn_ops_infer64_8.dll. Error code 126系列错误,里面包含了所有相关dll文件,下载后,解压缩,将ddl文件复制到C:\windows\system文件夹下,即可正常使用gpu,也可以找到安装CUDA的地址,默认在C:\windows\progrsmfile\NVIDIA GPU Computing Toolkit\CUDA\V11.6文件夹下的bin文件夹,复制ddl文件夹至该文件夹下,如果电脑自带CUDA,无法找到CUDA安装地址,将文件解压缩后放入C:\windows\system文件夹下,即可正常使用GPU,这种情况是不需要重装CUDA的,按照上述操作即可解决,正常使用GPU,如果有疑问,可以私信我,看到后我会及时回复。
2022-07-13 21:07:30 978.84MB cuda gpu 深度学习 tensorflow
NVIDIA公司提出的CUDA技术通过并发执行多个线程以实现大规模快速计算的能力。在研究CUDA技术在数字图像处理领域应用的基础上,提出了一种基于NVIDIA CODA的方法实现图像分割技术,把CUDA技术的快速计算的能力应用到数字图像处理领域。从CUDA技术的概况的介绍出发,对基于NVIDIA CUDA的图像分割方法以及该方法的详细实现过程进行了形式化的描述,解决了基于CPU的传统图像分割方法运行效率低的问题。实验结果证明CUDA在数字图像处理的实际应用中卓有成效。
2022-07-09 11:46:45 17.92MB cuda npp 图像分割
1
过滤器中的修剪过滤器 介绍 这是NeurIPS 2020论文“”的PyTorch实施。 在本文中: 我们提出了一种新的修剪模式,称为条带化修剪(SP),可以将其视为过滤修剪(FP)的一般情况。 SP将过滤器$ F \ in \ mathbb {R} ^ {C \ timesK \ times}}视为$ K \ timesK $条带(即,$ 1 \ times $$过滤器$ \ in \ mathbb {R} ^ c $),并以条带为单位而不是整个过滤器执行修剪。 与现有方法相比,SP具有比传统FP更好的粒度,同时比Weight-Pruning更加硬件友好,并且与Group-wise Pruning相比保持了过滤器之间的独立性,从而在CIFAR-10和ImageNet上实现了最先进的修剪率。 更令人振奋的是,通过应用SP,我们发现过滤器的另一个重要特性与重量无关:形状。 从随机初始化的R
2022-07-08 16:12:34 3.68MB skeleton stripe cuda pytorch
1
ubuntu20.04显卡驱动安装,CUDA 安装和卸载,cudnn安装教程
2022-07-06 14:14:07 754KB ubuntu NVidia
1
通过支持高性能嵌入式环境(Nvidia Jetson Nano)中的 CUDA 计算的 LAN 或 Wan 与 RTSP 流共享视频、屏幕、摄像头和音频,应用具有边界框定位和帧操作的入侵检测的实时 AI 技术。 更多详情、使用方法,请下载后阅读README.md文件
2022-07-04 18:03:53 1.59MB makefile