简洁:1.数据集采用flickr8k(图像,对应的文本描述),使用keras创建VGG16定义的CNN网络。利用VGG16(去掉最后一层)提取图像特征,将flickr8k的图像文件转为图像特征,保存为pickle文件。 2.写不下了,自己看吧,代码有注释 涉及技术:Pycharm + Keras + Python 3.6 + numpy + opencv3.3.1等 该项目是对Jason Brownlee的文章《How to Automatically Generate Textual Descriptions for Photographs with Deep Learning》的代码复现。
2021-05-11 21:22:12 11KB 深度学习 LSTM vgg16
1
数据集下载链接:https://www.imageclef.org/photodata 请把数据集放在:程序neural_image_captioning\datasets\中 完整工程:图像描述---Show and Tell: A Neural Image Caption Generator,使用keras实现图像描述,运行环境(keras==2.0.3,tensorflow==1.1.0,pandas==0.19.1,numpy==1.12.1,h5py==2.7.0,matplotlib==2.1.0,pillow==4.3.0)
2021-04-10 19:39:35 171.88MB imagecaption
1
近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。
2021-03-29 14:38:26 981KB 视觉到文本 图像生成描述
1
完整工程案例:图像描述---Show and Tell: A Neural Image Caption Generator,基于Inception V3与LSTM实现图像描述,运行环境(Tensorflow1.0及以上,Python3.6)
2019-12-21 20:05:50 519KB ImageCaption ShowAndTell 图像描述 CNN&LSTM;
1
完整工程案例:图像描述---Show and Tell: A Neural Image Caption Generator,基于Inception V3与LSTM实现图像描述,运行环境(Tensorflow1.0及以上,Python3.6)
2019-12-21 20:05:50 447KB 图片描述 ShowAndTell ImageCaption InceptionV3
1