Torrent_to_Drive
使用深度学习和Flickr-8k数据集进行自动图像字幕。 还对Xception模型和Inception模型进行了比较。
这是使用卷积神经网络和一种递归神经网络(LSTM)为所有类型的图像生成标题和替代文本的最简单方法。
关于
图像特征将从在imagenet数据集上训练的CNN模型中提取(请参见下文),然后将特征输入到LSTM模型中,后者将负责生成图像标题。
此回购围绕Keras提供的2个模型进行。
提取的功能可以在找到
使用的数据集可以在找到
Jupyter笔记本可以在找到
训练过的模型可以在找到
需求和依赖关系可以在找到
字幕生成器可以在找到
想要贡献? 建议,错误报告,错误解决受到高度赞赏,请打开问题和/或PR
建立
设置虚拟环境(强烈推荐)
激活环境。
安装需求,使用pip3 install -r requirements.txt 注意:
1