TimeSformer-Pytorch 实现,是一种基于关注点的纯净,简单的解决方案,可以在视频分类上达到SOTA。 该存储库将仅存储性能最佳的变体“时空分散注意力”,无非就是沿空间之前的时间轴的注意力。 安装 $ pip install timesformer-pytorch 用法 import torch from timesformer_pytorch import TimeSformer model = TimeSformer ( dim = 512 , image_size = 224 , patch_size = 16 , num_frames = 8 , num_classes = 10 , depth = 12 , heads = 8 , dim_head = 64 , attn_dropout =
1
TimeSformer在K600上预训练好的的模型:16 of frames,spatial crop:448,acc@1:81.8,acc@5:95.8。 TimeSformer:​Is Space-Time Attention All You Need for Video Understanding?​(video transformer)
2022-11-04 11:18:00 932.32MB TimeSformer videotransforme Python
1
TimeSformer:​Is Space-Time Attention All You Need for Video Understanding?​(video transformer) TimeSformer在K400上预训练好的的模型:8 of frames,spatial crop:224,acc@1:77.9,acc@5:93.2。
2022-10-06 19:30:18 927.65MB Timesformer预训练好 Python videotransforme
1
TimeSformer 这是的正式pytorch实现 。 在此存储库中,我们提供PyTorch代码以训练和测试我们建议的TimeSformer模型。 TimeSformer提供了一个有效的视频分类框架,该框架可以在多个视频动作识别基准(例如Kinetics-400)上达到最新的结果。 如果您发现TimeSformer对您的研究有用,请使用下面的BibTeX条目进行引用。 @misc { bertasius2021spacetime , title = { Is Space-Time Attention All You Need for Video Understanding? } , author = { Gedas Bertasius and Heng Wang and Lorenzo Torresani } , year = { 2021 }
2021-12-13 19:04:59 187KB Python
1
swin-timesformer 一个简单的滑动窗口Timesformer
2021-11-12 09:47:12 3KB Python
1