图像字幕生成
InceptionV3-多层GRU(Keras和TensorFlow)
要求:
Python 3.6
TensorFlow 1.13.1(安装tensorflow-1.13.1-cp36-cp36m-win_amd64.whl)
凯拉斯2.2.4
Joblib 1.0.1
Matplotlib 3.3.4
Open CV 4.5.1
熊猫1.1.5
Nltk 3.5
下载Flickr30k或MSCOCO数据集图像和标题。
训练模型的步骤:
克隆存储库以保留目录结构。
对于Flickr30k放在flickr30k图像文件夹或MSCOCO results_20130124.token和Flickr30k图像放captions_val2014.json和MSCOCO图像COCO-images文件夹中。
通过运行以下python keras2tensorflo
1