这是我利用GPU加速Opencv的时候自己在VS2015平台下编译好的库(VS2015+CUDA9.2+OpenCV3.4.2)
2022-01-12 12:08:03 173.34MB opencv cuda
1
PyTorch中的Deformable-ConvNets-V2 此存储库是的实现。 从原始移植。 有关完整框架,请参考此。 在可以找到基于mmdetection代码库的DCNv2的结果。 非常感谢强大而干净的框架。 master分支中的运算符与pytorch_v0.4.1兼容。 对于pytorch v1.0.0(由Jiajiai 实现)上的运算符,请参阅。 多亏了和mmlab的其他贡献者,DCNv2现在已基于该分支的主分支纳入正式的mmdetection回购中。 现在,它是使用新的cpp扩展api编写的,并且支持PyTorch 0.4.1和1.0,但速度和内存优化较小。 结果和模型可以在找到。 建造 sh make.sh 有关用法示例,请参见test.py和test_modulated.py 。 注意 此仓库提供了可变形的conv层,该层可在Deformable ConvNets
2022-01-12 11:11:04 36KB Cuda
1
countour2D_CUDA 这是程序的代码,它在CUDA中计算多边形数据的二维轮廓点 C Contour计算使用CUDA的二维多边形数据 最近我有一个轮廓计算的项目,并尝试在NVIDIA显卡上进行,因为它是现在普通机器上最快的平台之一。 有许多计算几何算法可用于对 2D 点数据进行轮廓计算,但几乎没有用于对多边形数组进行此类计算。 提供的算法使用蛮力来获取结果,但由于许多多线程计算,因此在使用 GPU 时可以正常工作。 算法很简单: 检测所有图形的线交叉点 计算所有点,它们位于方形“内部”轮廓和静止空间之间的边缘,这是用更大的力量制作的:围绕每个点程序生成具有 Epsilon 半径和 AngleStep 步长的圆,并且生成的圆的每个点是检查它是否位于场景的多边形之一上。 如果圆包含不属于任何多边形的扇区,则意味着这是边缘点,当然,是轮廓点。 程序运行良好,但可以优化。 希望你能使
2022-01-10 09:41:18 18KB Cuda
1
windows10环境下安装深度学习环境anaconda+pytorch+CUDA+cuDDN 步骤零:安装anaconda、opencv、pytorch(这些不详细说明)。复制运行代码,如果没有报错,说明已经可以了。不过大概率不行,我的会报错提示AssertionError: Torch not compiled with CUDA enabled。说明需要安装CUDA,或者安装的pytorch版本是不带CUDA的版本,需要按照以下步骤操作。 步骤一:安装CUDA 步骤二:安装cuDDN 步骤三:测试运行代码 附:电脑不支持CUDA或者不想用gpu加速深度学习的 1. 安装CUDA 这就是
2022-01-09 15:37:20 292KB anaconda c conda
1
非常简单的例子,把后缀改成.cu,安装好vs、opencv和cuda就能运行。cpu内存读取图片(单通道),拷贝到gpu纹理内存,再取出来放回cpu内存,主要体会关于内存的操作。非常适合初学者。
2022-01-09 02:59:01 3KB opencv gpu cuda vs2012
1
arm、 jetson nano 可用的 onnxruntime-gpu
2022-01-08 19:12:50 22.28MB 人工智能 onnxruntime cuda gpu
1
Nvidia CUDA 编程指南
2022-01-08 09:04:34 3.28MB cuda
1
CUDA:学习CUDA
2022-01-07 15:07:54 6KB Cuda
1
英伟达cuda认证通过代码
2022-01-06 23:47:22 4KB cuda 并行计算
1
cudnn-v7.6.5.zip
2022-01-06 11:08:07 948B cuda cudnn tensorflow pytorch
1