简洁:1.数据集采用flickr8k(图像,对应的文本描述),使用keras创建VGG16定义的CNN网络。利用VGG16(去掉最后一层)提取图像特征,将flickr8k的图像文件转为图像特征,保存为pickle文件。
2.写不下了,自己看吧,代码有注释
涉及技术:Pycharm + Keras + Python 3.6 + numpy + opencv3.3.1等
该项目是对Jason Brownlee的文章《How to Automatically Generate Textual Descriptions for Photographs with Deep Learning》的代码复现。
1