CUB_200_2011-ViT鸟类分类-高质量精讲
2024-06-05 11:20:15 64.67MB
本资源是文本生成图像的SSA-GAN模型复现过程中必备的鸟数据集元处理数据包。包括test、text、train、example_filenames.txt、example_captions.txt、captions.pickle等数据。
2022-07-24 21:05:34 6.19MB 文本生成图像 T2I SSAGAN GAN
1
本资源是文本生成图像的DF-GAN模型复现过程中必备的元处理数据包,包括DAMSMencoder的imageencoder和textencoder,FID评估使用的npz,class_info.pickle文件、filenames.pickle文件。 复现步骤请查看:https://blog.csdn.net/air__Heaven/article/details/125467190
2022-06-28 19:07:21 126.33MB 文本生成图像 GAN 生成对抗网络 DFGAN
数据集分割train和test程序
2022-06-27 14:09:31 522B CUB
1
数字图像处理大作业,图像细粒度分类,CUB-200-2011,Peking University
2022-05-31 14:06:39 4.76MB python 图像处理
这是FID预训练好的模型,针对CUB-birds的文本生成图像定量指标训练好的模型 FID分数用于根据预训练网络提取的特征,测量真实图像分布和生成图像分布之间的距离。真实图像在空间中是服从一个分布的(假设为正态分布),而GAN生成的特征也是一个分布,GAN做的事情就是不断训练使这两个分布尽可能的相同。FID就是计算这两个分布直接的距离,使用的距离算法叫做Frechet distance。
2022-05-13 17:06:48 30.67MB 文档资料 自然语言处理 人工智能 nlp
这个是已经训练好的DFGAN,针对CUB的生成器模型,训练轮数601轮 默认bird.yml: CONFIG_NAME: 'bird' DATASET_NAME: 'bird' DATA_DIR: '../data/bird' GPU_ID: 0 WORKERS: 1 B_VALIDATION: True # True # False loss: 'hinge' TREE: BRANCH_NUM: 1 BASE_SIZE: 256 TRAIN: NF: 32 # default 64 BATCH_SIZE: 24 MAX_EPOCH: 601 NET_G: '../test' TEXT: EMBEDDING_DIM: 256 CAPTIONS_PER_IMAGE: 10 DAMSM_NAME: '../DAMSMencoders/bird/inception/text_encoder200.pth'
2022-05-12 16:06:21 46.75MB GAN 生成器 深度学习 文本生成图像
预训练好的inception model 是StackGAN 用来于鸟评估的inception score模型 也可以用于AttnGAN、DF-GAN等等文本生成图像模型当中 主要用于评估图像质量
2022-05-12 12:05:15 345.43MB 文档资料 文本生成图像 深度学习 GAN
MMAL网 这是论文用于细粒度的PyTorch实施(张帆,李萌,翟桂生,刘亦钊)由第27届国际多媒体建模国际会议(MMM2021)提供。 欢迎与我们讨论问题! 目录 要求 的Python 3.7 pytorch 1.3.1 numpy的1.17.3 scikit图像0.16.2 Tensorboard 1.15.0 TensorboardX 2.0 tqdm 4.41.1 图像2.6.1 枕头6.1.0 数据集 下载数据集,并将提取的图像文件夹的内容复制到datasets / CUB 200-2011 / images中。 下载数据集并将提取的data / images文件夹的内容复制到datasets / FGVC_Aircraft / data / images ) 您也可以尝试其他细粒度的数据集。 培训TBMSL-Net 如果要训练MMAL-Net,请在运行py
1
Digital-Image-Processing-Project 数字图像处理大作业,图像细粒度分类,CUB-200-2011,Peking University
2021-12-24 17:24:48 4.76MB Python
1