上传者: 42165018
|
上传时间: 2021-10-20 11:38:59
|
文件大小: 181.31MB
|
文件类型: -
用于多标签视频分类的CRF
概述
该存储库包含用于多标签视频分类的CRF结构的PyTorch实现。 它使用I3D预训练模型作为基础分类器(Joao Carreira和Andrew Zisserman在论文“ ”中报告了I3D)。
该代码基于Deepmind的和AJ Piergiovanni的I3D管道的。
要求
该代码是使用Python 3.6和 0.4.0开发的。 它需要和 。
端到端培训I3D +半/全CRF
该管道使用Deepmind的预训练的I3D模型(在ImageNet和Kinetics上进行预,有关详细信息,请参见 )。 这些是在目录models /中找到的表示为rgb_imagenet.pt和flow_imagenet.pt的模型。
基本模型(I3D)
可以使用以下命令来训练基本模型:
python train_i3d.py -dataset 'charades' -