本资源是文本生成图像的DF-GAN模型复现过程中必备的元处理数据包,包括DAMSMencoder的imageencoder和textencoder,FID评估使用的npz,class_info.pickle文件、filenames.pickle文件。 复现步骤请查看:https://blog.csdn.net/air__Heaven/article/details/125467190
2022-06-28 19:07:21 126.33MB 文本生成图像 GAN 生成对抗网络 DFGAN
本压缩包是文本生成图像里的 R分数实验代码 R-precision评估指标定量工程文件,可以用来评估文本与图像的对齐性(即生成的图像是否符合文本),工程包括build_RPdata.py、config.py、encoder.py、eval_Rprecision.py、all_texts.txt。 运行时: 1.先更改参数,将文件位置改成你已经生成好的图像的位置 2.运行build_RPdata.py,生成RPdata的数据,即每个数据是一个图像+n条句子 3.运行eval_Rprecision.py,评估图像与文本的对齐度 4.还可以更改R值,继续3进行各种实验
2022-06-13 09:06:47 1.33MB 文本生成图像 R-precision
废话了,我们经常为图片生成缩略图,在windows中视频在察看缩略图的时候也显示出图片来,如果作一个视频系统,那么用户上传上来的视频,如何为其生成缩略图呢?要想操作视频文件,通常所用的方法就是DirectX里面的DriectShow,用它就可以实现抓屏,抓图,抓视频的功能,想到这,又惊奇于ms演示的vista下的app那绚的3d效果. 要想在.net中使用DirectShow,所做的第一件事情是需要一个程序集,这个程序集可以帮你完成.net对directshow的调用,而且您不需要用com,省却注册过程,这个assembly的名字为:Interop.DexterLib.dll, 它象其他dll,只需添加引用即可。
2022-05-24 14:44:32 746KB asp.net 视频 抓取图像
1
这是FID预训练好的模型,针对CUB-birds的文本生成图像定量指标训练好的模型 FID分数用于根据预训练网络提取的特征,测量真实图像分布和生成图像分布之间的距离。真实图像在空间中是服从一个分布的(假设为正态分布),而GAN生成的特征也是一个分布,GAN做的事情就是不断训练使这两个分布尽可能的相同。FID就是计算这两个分布直接的距离,使用的距离算法叫做Frechet distance。
2022-05-13 17:06:48 30.67MB 文档资料 自然语言处理 人工智能 nlp
这个是已经训练好的DFGAN,针对CUB的生成器模型,训练轮数601轮 默认bird.yml: CONFIG_NAME: 'bird' DATASET_NAME: 'bird' DATA_DIR: '../data/bird' GPU_ID: 0 WORKERS: 1 B_VALIDATION: True # True # False loss: 'hinge' TREE: BRANCH_NUM: 1 BASE_SIZE: 256 TRAIN: NF: 32 # default 64 BATCH_SIZE: 24 MAX_EPOCH: 601 NET_G: '../test' TEXT: EMBEDDING_DIM: 256 CAPTIONS_PER_IMAGE: 10 DAMSM_NAME: '../DAMSMencoders/bird/inception/text_encoder200.pth'
2022-05-12 16:06:21 46.75MB GAN 生成器 深度学习 文本生成图像
预训练好的inception model 是StackGAN 用来于鸟评估的inception score模型 也可以用于AttnGAN、DF-GAN等等文本生成图像模型当中 主要用于评估图像质量
2022-05-12 12:05:15 345.43MB 文档资料 文本生成图像 深度学习 GAN
GAN_fashion_MNIST 基于流行的MNIST生成图像的基本gan 运行说明:只需运行gan.py 对DL4J.com的引用,以上代码改编自它们的代码
2022-05-04 16:24:04 2KB Python
1
已经配置好了预训练模型和训练好的模型 已经配置好了下载为鸟类预处理的元数据 除了没有CUB-birds的图像数据集,其他文件都已经下载并配置好了。 AttnGAN: Fine-Grained TexttoImage Generation with Attention(带有注意的生成对抗网络细化文本到图像生成)的代码复现 下载后需要安装环境 >pip install python-dateutil > pip install easydict > pip install pandas > pip install torchfile nltk > pip install scikit-image 可能需要额外安装的环境,根据提示进行补充: > pip install torchvision
2022-04-06 03:11:56 232.57MB GAN t2i 文本生成图像
GIQA:生成的图像质量评估 这是ECCV2020“ GIQA:生成的图像质量评估”的正式pytorch实现( )。 该存储库的主要贡献者包括Microsoft Research Asia的Gu Shuyang,Bao Jianmin Bao,Dong Chen和Fang Wen。 相关论文采用GMM-GIQA来改善GAN的性能:PriorGAN( )。 介绍 GIQA旨在解决单个生成图像的质量评估问题。 在此源代码中,我们发布了易于使用的GMM-GIQA和KNN-GIQA代码。 引文 如果您发现我们的代码对您的研究有所帮助,请考虑引用: @article{gu2020giqa, title={GIQA: Generated Image Quality Assessment}, author={Gu, Shuyang and Bao, Jianmin and Chen, D
1
自动生成图片描述是自然语言处理和计算机视觉的热点研究话题,要求计算机理解图像语义信息并用人类自然语言的形式进行文字表述.针对当前生成中文图像描述整体质量不高的问题,提出首先利用FastText生成词向量,利用卷积神经网络提取图像全局特征;然后将成对的语句和图像〈S,I〉进行编码,并融合为两者的多模态特征矩阵;最后模型采用多层的长短时记忆网络对多模态特征矩阵进行解码,并通过计算余弦相似度得到解码的结果.通过对比发现所提模型在双语评估研究(BLEU)指标上优于其他模型,生成的中文描述可以准确概括图像的语义信息.
1