AVA 是一个项目,它提供视频的视听注释,以提高我们对人类活动的理解。 AVA 是一个项目,它提供视频的视听注释,以提高我们对人类活动的理解。每个视频片段都经过人工注释者的详尽注释,它们共同代表了丰富多样的场景、录制条件和人类活动的表达方式。
AVA-Kinetics 数据集包含来自 AVA v2.2 的 430 个原始视频,以及来自 Kinetics-700 数据集的 238k 个视频。对于 Kinetics,我们为每个视频剪辑提供一个带注释的帧。注释以 CSV 文件的形式提供,如包含的 README.txt 文件中所述。
所有注释都在 .tar.gz 文件中提供。尽管 AVA 和 Kinetics 有单独的 CSV 文件,但预计用户会希望在两者的结合上进行训练/测试。
2022-08-10 09:06:33
14.72MB
训练集
1