什么是新的: 2020年11月:现已上市,提供培训! 2020-11-20:Classy Vision v0.5发布 新的功能 使用发布模型实现(#646) 实施渐变裁剪(#643) 已实现梯度累加(#644) 添加了对支持(#636) 添加了精确的批处理规范挂钩(#592) 增加了对fully_convolutional_linear_head (#602)中的自适应池的支持 添加了对同步批处理规范组大小的支持(#534) 添加了CSV挂钩以手动检查模型预测 添加了ClassyModel教程(#485) 迁移到 (#536) 从迁移(#488) 重大变化 ClassyOptimizer API的改进添加了OptionsView以从优化器param_group检索选项 删除了ClassyModel.evaluation_mode (#521) 删除了ImageNetD
2021-12-29 10:53:25 1.41MB Python
1
视频分类 动态RNN(LSTM,GRU) 使用视频完全具有的所有帧而无需填充。 静态RNN(LSTM,GRU) 使用固定数量的帧。 如果视频长度大于固定数量,则使用统一或随机采样。 如果视频长度小于固定数量,则将使用所有帧,并使用“零功能”填充视频。 汇集 平均池化 使用所有框架。 均匀采样固定数量的帧。 如果视频长度小于固定数量,则使用所有帧。 随机采样固定数量的帧。 如果视频长度小于固定数量,则使用所有帧。 最大池化 使用所有框架。 均匀采样固定数量的帧。 如果视频长度小于固定数量,则使用所有帧。 随机采样固定数量的帧。 如果视频长度小于固定数量,则使用所有帧。 对于ConvLSTM,输入(帧/图像特征)和状态为3D张量(侧面,侧面,通道)。 ConvLSTM中的操作不是完全连接,而是后果。 继续... 如果您认为此代码有用,请考虑引用与我的视频相关的作品:
2021-12-21 14:56:15 1.05MB Python
1
图神经网络在视频分类中的应用,选自于SFFAI第27期,中科院自动化所高君宇博士的演讲稿。
2021-11-15 09:40:34 5.4MB GNN
1
用于多标签视频分类的CRF 概述 该存储库包含用于多标签视频分类的CRF结构的PyTorch实现。 它使用I3D预训练模型作为基础分类器(Joao Carreira和Andrew Zisserman在论文“ ”中报告了I3D)。 该代码基于Deepmind的和AJ Piergiovanni的I3D管道的。 要求 该代码是使用Python 3.6和 0.4.0开发的。 它需要和 。 端到端培训I3D +半/全CRF 该管道使用Deepmind的预训练的I3D模型(在ImageNet和Kinetics上进行预,有关详细信息,请参见 )。 这些是在目录models /中找到的表示为rgb_imagenet.pt和flow_imagenet.pt的模型。 基本模型(I3D) 可以使用以下命令来训练基本模型: python train_i3d.py -dataset 'charades' -
2021-10-20 11:38:59 181.31MB JupyterNotebook
1
Collective Activity 是一个集体活动的短视频数据集,它包含 5 种不同的集体活动,分别为交叉、步行、等待、交谈、排队以及 44 个短视频序列,其中一些是由消费者手持数码相机记录的。 该数据集于 2009 年由密歇根大学安娜堡分校电气工程系发布。 主要发布人:Wongun Choi, Khuram Shahid, Silvio Savarese 相关论文:《Collective Activity Classification Using Spatio-Temporal Relationship Among People》
2021-10-13 10:24:19 11KB 视频分类
1
在下载模型 自述文件正在建设中:)
2021-09-26 15:29:40 19KB Python
1
使用3D ResNet进行视频分类 这是使用训练的3D ResNet进行视频(动作)分类的pytorch。 在Kinetics数据集上训练了3D ResNet,该数据集包括400个动作类。 此代码将视频用作输入,并在得分模式下输出每16帧的班级名称和预测班级得分。 在功能模式下,此代码每16帧输出512个暗角的功能(在全局平均池化之后)。 提供此代码的Torch(Lua)版本。 要求 conda install pytorch torchvision cuda80 -c soumith FFmpeg,FFprobe wget http://johnvansickle.com/ffmpeg/
2021-09-13 16:24:53 154KB python computer-vision deep-learning pytorch
1
CNN LSTM 带有Resnet后端的CNN LSTM用于视频分类的实现 入门 先决条件 PyTorch(需要0.4以上版本) FFmpeg,FFprobe 的Python 3 尝试自己的数据集 mkdir data mkdir data/video_data 将您的视频数据集放入data / video_data中。格式应为- + data + video_data - bowling - walking + running - running0.avi - running.avi - runnning1.avi 从视频数据集中生成图像 ./utils/generate
2021-09-08 23:55:24 228KB Python
1
行业-电子政务-视频分类方法、装置、存储介质及电子设备[2].zip
行业-电子政务-视频分类模型训练方法、装置、存储介质及电子设备.zip