上传者: 42181888
|
上传时间: 2021-12-27 14:48:53
|
文件大小: 41.21MB
|
文件类型: -
用于高分辨率图像合成的驯服变压器
*,*,*平等贡献
tl; dr通过引入卷积VQGAN,我们将卷积方法的效率与转换器的表达能力相结合,该算法学习了上下文相关的视觉部分的密码本,其组成是使用自回归转换器建模的。
| |
消息
我们添加了一个,用于比较两个VQGAN和OpenAI的 。 另请参阅。
我们现在包括预训练模式的概况 。 我们添加了和模型。
流式演示现在支持图像完成。
现在,我们包括D-RIN数据集中的几个示例,因此您可以运行而无需先准备数据集。
现在,您可以使用我们的采样。
要求
可以使用以下方法创建并激活一个名为taming合适的环境:
conda env create -f environment.yaml
conda activate taming
预训练模型概述
下表概述了当前可用的所有型号。 FID分数是使用进行评估的,而没有拒绝抽样。 作为参考,我们