TimeSformer
这是的正式pytorch实现 。 在此存储库中,我们提供PyTorch代码以训练和测试我们建议的TimeSformer模型。 TimeSformer提供了一个有效的视频分类框架,该框架可以在多个视频动作识别基准(例如Kinetics-400)上达到最新的结果。
如果您发现TimeSformer对您的研究有用,请使用下面的BibTeX条目进行引用。
@misc { bertasius2021spacetime ,
title = { Is Space-Time Attention All You Need for Video Understanding? } ,
author = { Gedas Bertasius and Heng Wang and Lorenzo Torresani } ,
year = { 2021 }