CUDA_VGGNET16 使用cuda实现VGGNet16。 实现4个转换内核,2个池内核。 要求 Cuda-9.0,Cudnn-7.5,CUDA-Toolkit,NVCC 用法 cmake 在root目录下cmake . 添加依赖关系并导入NVTX和NVML。 进口权重和偏差 下载vgg16 caffemodel“ ”并通过run -xvf data.zip解压缩。 编译 在CUDA_VGGNET16/Src/vgg运行make生成可运行文件和ptx文件。 查找图片 找到一个图像并运行python Convert_image_to_txt.py以生成224 * 224尺寸的图像。 跑步 格式: ./vgg image_path
2021-12-02 20:17:22 13.21MB C++
1
CUDA实验 CUDA实验
2021-12-02 16:47:18 11KB Cuda
1
:NVIDIA公司提出的CUDA技术通过并发执行多个线程以实现大规模快速计算的能力。在研究CUDA技术在数字图像处理领域应用的基础上,提出了一种基于NVIDIA CODA的方法实现图像边缘检测,把CUDA技术的快速计算的能力应用到数字图像处理领域。从CUDA技术的概况的介绍出发,对基于NVIDIA CUDA的图像边缘检测方法以及该方法的详细实现过程进行了形式化的描述,解决了基于CPU的传统图像边缘检测方法运行效率低的问题。实验结果证明CUDA在数字图像处理的实际应用中卓有成效。
2021-12-02 16:44:14 235KB CUDA 图像边缘检测方法
1
CUDA高性能计算并行编程CUDA高性能计算并行编程CUDA高性能计算并行编程
2021-12-02 16:38:11 1.65MB cuda gpu 并行
1
CUDA by example一书所附的源代码
2021-12-01 11:26:06 288KB CUDA 源代码 GPU
1
安装cuda以及Pytorch遇到的问题
2021-11-30 12:06:53 658KB cuda
1
CUDA程序在linux环境下实现并行的搜索最短路径,速度更快。
2021-11-29 20:51:47 61KB 并行 最短路径
1
参考官网地址: Windows端:https://tensorflow.google.cn/install/source_windows CPU Version Python version Compiler Build tools tensorflow-1.11.0 3.5-3.6 MSVC 2015 update 3 Cmake v3.6.3 tensorflow-1.10.0 3.5-3.6 MSVC 2015 update 3 Cmake v3.6.3 tensorflow-1.9.0 3.5-3.6 MSVC 2015 update 3 Cmake v3.6.3
2021-11-29 10:33:34 76KB bazel cmake cuda
1
cuda函数中文手册
2021-11-28 23:35:18 1.09MB cuda函数中文
1
应用CUDA,opencv实现图像的高斯平滑处理, 读取待处理的图像; 定义中间数据传递的指针并分配内存; 将数据从Host端传到Device端; 网格和块的分配; 执行kernel函数; 将数据从Device端传回到Host端; 最后释放内存。
2021-11-28 11:42:04 2KB cuda opencv 高斯平滑
1