countour2D_CUDA 这是程序的代码,它在CUDA中计算多边形数据的二维轮廓点 C Contour计算使用CUDA的二维多边形数据 最近我有一个轮廓计算的项目,并尝试在NVIDIA显卡上进行,因为它是现在普通机器上最快的平台之一。 有许多计算几何算法可用于对 2D 点数据进行轮廓计算,但几乎没有用于对多边形数组进行此类计算。 提供的算法使用蛮力来获取结果,但由于许多多线程计算,因此在使用 GPU 时可以正常工作。 算法很简单: 检测所有图形的线交叉点 计算所有点,它们位于方形“内部”轮廓和静止空间之间的边缘,这是用更大的力量制作的:围绕每个点程序生成具有 Epsilon 半径和 AngleStep 步长的圆,并且生成的圆的每个点是检查它是否位于场景的多边形之一上。 如果圆包含不属于任何多边形的扇区,则意味着这是边缘点,当然,是轮廓点。 程序运行良好,但可以优化。 希望你能使
2022-01-10 09:41:18 18KB Cuda
1
windows10环境下安装深度学习环境anaconda+pytorch+CUDA+cuDDN 步骤零:安装anaconda、opencv、pytorch(这些不详细说明)。复制运行代码,如果没有报错,说明已经可以了。不过大概率不行,我的会报错提示AssertionError: Torch not compiled with CUDA enabled。说明需要安装CUDA,或者安装的pytorch版本是不带CUDA的版本,需要按照以下步骤操作。 步骤一:安装CUDA 步骤二:安装cuDDN 步骤三:测试运行代码 附:电脑不支持CUDA或者不想用gpu加速深度学习的 1. 安装CUDA 这就是
2022-01-09 15:37:20 292KB anaconda c conda
1
非常简单的例子,把后缀改成.cu,安装好vs、opencv和cuda就能运行。cpu内存读取图片(单通道),拷贝到gpu纹理内存,再取出来放回cpu内存,主要体会关于内存的操作。非常适合初学者。
2022-01-09 02:59:01 3KB opencv gpu cuda vs2012
1
arm、 jetson nano 可用的 onnxruntime-gpu
2022-01-08 19:12:50 22.28MB 人工智能 onnxruntime cuda gpu
1
Nvidia CUDA 编程指南
2022-01-08 09:04:34 3.28MB cuda
1
CUDA:学习CUDA
2022-01-07 15:07:54 6KB Cuda
1
英伟达cuda认证通过代码
2022-01-06 23:47:22 4KB cuda 并行计算
1
cudnn-v7.6.5.zip
2022-01-06 11:08:07 948B cuda cudnn tensorflow pytorch
1
CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。
2022-01-05 19:24:00 50.96MB CUDA
1
深度学习是解决难题(例如图像分类,分割和检测)的强大方法。 然而,使用深度学习进行推理是计算密集型的,消耗大量内存。 即使是规模很小的网络也需要大量的内存和硬件来执行这些算术运算。 这些限制可能会阻止将深度学习网络部署到计算能力低且内存资源较小的设备上。 在这种情况下,您可以将 Deep Learning Toolbox 与 Deep Learning Toolbox 模型量化库支持包结合使用,通过将卷积层的权重、偏差和激活量化为 8 位缩放整数来减少深度神经网络的内存占用数据类型。 然后您可以使用 GPU Coder 为量化网络生成优化的 CUDA 代码。 此示例展示了如何创建、训练和量化一个用于缺陷检测的简单卷积神经网络,然后演示如何为包括前/后图像处理和卷积神经网络在内的整个算法生成代码,以便您可以将其部署到 NVIDIA GPU 中,例如Jetson AGX Xavier、N
2022-01-05 12:26:50 8.71MB matlab
1