上传者: 42099936
|
上传时间: 2021-12-02 20:17:22
|
文件大小: 13.21MB
|
文件类型: -
CUDA_VGGNET16
使用cuda实现VGGNet16。 实现4个转换内核,2个池内核。
要求
Cuda-9.0,Cudnn-7.5,CUDA-Toolkit,NVCC
用法
cmake
在root目录下cmake . 添加依赖关系并导入NVTX和NVML。
进口权重和偏差
下载vgg16 caffemodel“ ”并通过run -xvf data.zip解压缩。
编译
在CUDA_VGGNET16/Src/vgg运行make生成可运行文件和ptx文件。
查找图片
找到一个图像并运行python Convert_image_to_txt.py以生成224 * 224尺寸的图像。
跑步
格式: ./vgg image_path