上传者: 42150341
|
上传时间: 2022-03-27 15:27:54
|
文件大小: 95KB
|
文件类型: -
图片字幕
介绍
该项目是论文。 它可能并不完全相似。
使用Pytorch作为代码。 ResNet101用于提取功能。 您可以检查预训练的模型。
使用2017 Val图像[5K / 1GB],注释[241MB]。
请检查make_vocab.py和data_loader.py。
Vocab.pickle是一个pickle文件,其中包含注释中的所有单词。
coco_ids.npy存储要使用的图像ID。 另外,您必须设置路径或其他设置。 执行prerocess_idx函数。
您可以运行源代码并尝试自己的示例。
环境
的Python 3.8.5
火炬1.7.1
CUDA 11.0
如何使用
火车
cd src
python train.py
进行测试
cd src
python sample.py
结果
时代100
说明文字:一名妇女在手提箱中手持一只泰迪熊
待办事项清单
张量