诸如GAN之类的生成模型的评估是深度学习研究的重要组成部分。 在2D图像生成领域,三种方法得到了广泛传播:初始分数(aka IS) ,弗雷谢特初始距离(aka FID) 和内核初始距离(aka KID) 。
这些指标尽管具有清晰的数学和算法描述,但最初是在TensorFlow中实现的,并继承了框架本身的一些属性(请参阅Interpolation)和它们所依赖的代码(请参见Model)。 这些设计决策已有效地纳入评估协议,并成为度量标准规范的固有组成部分。 结果,希望在生成建模中与最新技术进行比较的研究人员被迫使用原始度量标准作者的代码库进行评估。 虽然可以在PyTorch和其他框架中重新实现指标,但是它们不能提供适当级别的保真度,因此使其不适合报告结果并将其与其他方法进行比较。
该软件旨在在PyTorch中提供上述指标的epsilon精确实现,从而消除与生成模型评估和开发相关的不便
2022-03-13 20:45:42
167KB
Python
1