视觉变压器-火炬
视觉变压器的Pytorch实现。 提供了预先训练的pytorch权重,这些权重是从原始jax /亚麻权重转换而来的。 这是和的项目。
介绍
Pytorch实施的论文 。 我们提供从预训练的jax /亚麻模型转换而来的预训练的pytorch权重。 我们还提供微调和评估脚本。 获得了与类似的结果。
安装
创建环境:
conda create --name vit --file requirements.txt
conda activate vit
可用型号
我们提供,这些是从原始jax / flax wieghts转换而来的。 您可以下载它们并将文件放在“ weights / pytorch”下以使用它们。
否则,您可以下载,并将这些帧放在“ weights / jax”下以使用它们。 我们将在线为您转换权重。
数据集
当前支持三个数据集:ImageNet2012,CI
1