a-PyTorch-Tutorial-to-Image-Captioning:显示,参加和讲述| PyTorch教程以进行图像字幕-源码

上传者: 42137723 | 上传时间: 2021-09-10 10:23:35 | 文件大小: 9.74MB | 文件类型: ZIP
这是图像字幕的教程。 这是我正在编写的第一篇,是关于如何使用令人惊叹的PyTorch库自己实现酷模型的。 假定具备PyTorch,卷积和递归神经网络的基本知识。 如果您是PyTorch的新手,请先阅读PyTorch的和 。 问题,建议或更正可以作为问题发布。 我在Python 3.6使用PyTorch 0.4 。 2020年1月27日:添加了两个新教程的工作代码-和 内容 客观的 为了构建可以为图像生成描述性标题的模型,我们提供了它。 为了使事情简单,让我们实现“显示,出席和讲述”文件。 这绝不是当前的最新技术,但仍然相当惊人。 作者的原始实现可以在此处找到。 该模型学习在哪里看。 当您逐字生成标题时,可以看到模型的视线在图像上移动。 这是有可能的,因为它具有“注意”机制,该机制可以使其专注于图像中与下一个要说的单词最相关的部分。 以下是在训练或验证期间未看到的测试图

文件下载

资源详情

[{"title":"( 36 个子文件 9.74MB ) a-PyTorch-Tutorial-to-Image-Captioning:显示,参加和讲述| PyTorch教程以进行图像字幕-源码","children":[{"title":"a-PyTorch-Tutorial-to-Image-Captioning-master","children":[{"title":"train.py <span style='color:#111;'> 13.18KB </span>","children":null,"spread":false},{"title":"create_input_files.py <span style='color:#111;'> 479B </span>","children":null,"spread":false},{"title":"caption.py <span style='color:#111;'> 8.19KB </span>","children":null,"spread":false},{"title":"img","children":[{"title":"babycake.png <span style='color:#111;'> 428.87KB </span>","children":null,"spread":false},{"title":"bikefence.png <span style='color:#111;'> 684.55KB </span>","children":null,"spread":false},{"title":"weights.png <span style='color:#111;'> 1.05KB </span>","children":null,"spread":false},{"title":"catbanana.png <span style='color:#111;'> 516.73KB </span>","children":null,"spread":false},{"title":"biketrain.png <span style='color:#111;'> 661.65KB </span>","children":null,"spread":false},{"title":"att.png <span style='color:#111;'> 160.79KB </span>","children":null,"spread":false},{"title":"dogtie.png <span style='color:#111;'> 549.21KB </span>","children":null,"spread":false},{"title":"manbike.png <span style='color:#111;'> 697.85KB </span>","children":null,"spread":false},{"title":"tommy.png <span style='color:#111;'> 381.39KB </span>","children":null,"spread":false},{"title":"doublystochastic.png <span style='color:#111;'> 1.11KB </span>","children":null,"spread":false},{"title":"decoder_no_att.png <span style='color:#111;'> 105.13KB </span>","children":null,"spread":false},{"title":"decoder_att.png <span style='color:#111;'> 955.07KB </span>","children":null,"spread":false},{"title":"sheep.png <span style='color:#111;'> 534.68KB </span>","children":null,"spread":false},{"title":"model.png <span style='color:#111;'> 451.90KB </span>","children":null,"spread":false},{"title":"boats.png <span style='color:#111;'> 672.07KB </span>","children":null,"spread":false},{"title":"sorted2.jpg <span style='color:#111;'> 318.03KB </span>","children":null,"spread":false},{"title":"birds.png <span style='color:#111;'> 410.84KB </span>","children":null,"spread":false},{"title":"beam_search.png <span style='color:#111;'> 576.10KB </span>","children":null,"spread":false},{"title":"plane.png <span style='color:#111;'> 417.34KB </span>","children":null,"spread":false},{"title":"salad.png <span style='color:#111;'> 587.13KB </span>","children":null,"spread":false},{"title":"sorted.jpg <span style='color:#111;'> 149.05KB </span>","children":null,"spread":false},{"title":"firehydrant.png <span style='color:#111;'> 729.75KB </span>","children":null,"spread":false},{"title":"encoder.png <span style='color:#111;'> 322.52KB </span>","children":null,"spread":false}],"spread":false},{"title":"utils.py <span style='color:#111;'> 10.07KB </span>","children":null,"spread":false},{"title":"datasets.py <span style='color:#111;'> 2.28KB </span>","children":null,"spread":false},{"title":".idea","children":[{"title":"misc.xml <span style='color:#111;'> 195B </span>","children":null,"spread":false},{"title":"caption.iml <span style='color:#111;'> 441B </span>","children":null,"spread":false},{"title":"modules.xml <span style='color:#111;'> 266B </span>","children":null,"spread":false},{"title":"vcs.xml <span style='color:#111;'> 180B </span>","children":null,"spread":false}],"spread":true},{"title":"models.py <span style='color:#111;'> 9.25KB </span>","children":null,"spread":false},{"title":"LICENSE <span style='color:#111;'> 1.05KB </span>","children":null,"spread":false},{"title":"eval.py <span style='color:#111;'> 7.06KB </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 33.51KB </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明