搜索【视频分类】的结果

什么是新的： 2020年11月：现已上市，提供培训！ 2020-11-20：Classy Vision v0.5发布新的功能使用发布模型实现（＃646）实施渐变裁剪（＃643）已实现梯度累加（＃644）添加了对支持（＃636）添加了精确的批处理规范挂钩（＃592）增加了对fully_convolutional_linear_head （＃602）中的自适应池的支持添加了对同步批处理规范组大小的支持（＃534）添加了CSV挂钩以手动检查模型预测添加了ClassyModel教程（＃485）迁移到（＃536）从迁移（＃488）重大变化 ClassyOptimizer API的改进添加了OptionsView以从优化器param_group检索选项删除了ClassyModel.evaluation_mode （＃521）删除了ImageNetD

2021-12-29 10:53:25 1.41MB Python

1

video-classification:TensorFlow实现视频分类-源码

视频分类动态RNN（LSTM，GRU）使用视频完全具有的所有帧而无需填充。静态RNN（LSTM，GRU）使用固定数量的帧。如果视频长度大于固定数量，则使用统一或随机采样。如果视频长度小于固定数量，则将使用所有帧，并使用“零功能”填充视频。汇集平均池化使用所有框架。均匀采样固定数量的帧。如果视频长度小于固定数量，则使用所有帧。随机采样固定数量的帧。如果视频长度小于固定数量，则使用所有帧。最大池化使用所有框架。均匀采样固定数量的帧。如果视频长度小于固定数量，则使用所有帧。随机采样固定数量的帧。如果视频长度小于固定数量，则使用所有帧。对于ConvLSTM，输入（帧/图像特征）和状态为3D张量（侧面，侧面，通道）。 ConvLSTM中的操作不是完全连接，而是后果。继续... 如果您认为此代码有用，请考虑引用与我的视频相关的作品：

2021-12-21 14:56:15 1.05MB Python

1

图神经网络在视频分类中的应用，SFFAI-第27期图神经网络专题.zip

图神经网络在视频分类中的应用，选自于SFFAI第27期，中科院自动化所高君宇博士的演讲稿。

2021-11-15 09:40:34 5.4MB GNN

1

i3d_crf:用于视频分类的I3D模型的PyTorch实现，与用于多标签分类的CRF平滑层混合-源码

用于多标签视频分类的CRF 概述该存储库包含用于多标签视频分类的CRF结构的PyTorch实现。它使用I3D预训练模型作为基础分类器（Joao Carreira和Andrew Zisserman在论文“ ”中报告了I3D）。该代码基于Deepmind的和AJ Piergiovanni的I3D管道的。要求该代码是使用Python 3.6和 0.4.0开发的。它需要和。端到端培训I3D +半/全CRF 该管道使用Deepmind的预训练的I3D模型（在ImageNet和Kinetics上进行预，有关详细信息，请参见）。这些是在目录models /中找到的表示为rgb_imagenet.pt和flow_imagenet.pt的模型。基本模型（I3D）可以使用以下命令来训练基本模型： python train_i3d.py -dataset 'charades' -

2021-10-20 11:38:59 181.31MB JupyterNotebook

1

Collective Activity 集体活动视频数据集.torrent

Collective Activity 是一个集体活动的短视频数据集，它包含 5 种不同的集体活动，分别为交叉、步行、等待、交谈、排队以及 44 个短视频序列，其中一些是由消费者手持数码相机记录的。该数据集于 2009 年由密歇根大学安娜堡分校电气工程系发布。主要发布人：Wongun Choi, Khuram Shahid, Silvio Savarese 相关论文：《Collective Activity Classification Using Spatio-Temporal Relationship Among People》

2021-10-13 10:24:19 11KB 视频分类

1

Activity-Recognition-TensorRT:TensorRT加速了3D ResNet视频分类-源码

在下载模型自述文件正在建设中：）

2021-09-26 15:29:40 19KB Python

1

video-classification-3d-cnn-pytorch：使用3D ResNet的视频分类工具-源码

使用3D ResNet进行视频分类这是使用训练的3D ResNet进行视频（动作）分类的pytorch。在Kinetics数据集上训练了3D ResNet，该数据集包括400个动作类。此代码将视频用作输入，并在得分模式下输出每16帧的班级名称和预测班级得分。在功能模式下，此代码每16帧输出512个暗角的功能（在全局平均池化之后）。提供此代码的Torch（Lua）版本。要求 conda install pytorch torchvision cuda80 -c soumith FFmpeg，FFprobe wget http://johnvansickle.com/ffmpeg/

2021-09-13 16:24:53 154KB python computer-vision deep-learning pytorch

1

cnn-lstm:在Pytorch中实现的CNN LSTM架构用于视频分类-源码

CNN LSTM 带有Resnet后端的CNN LSTM用于视频分类的实现入门先决条件 PyTorch（需要0.4以上版本） FFmpeg，FFprobe 的Python 3 尝试自己的数据集 mkdir data mkdir data/video_data 将您的视频数据集放入data / video_data中。格式应为- + data + video_data - bowling - walking + running - running0.avi - running.avi - runnning1.avi 从视频数据集中生成图像 ./utils/generate

2021-09-08 23:55:24 228KB Python

1

行业-电子政务-视频分类方法、装置、存储介质及电子设备[2].zip

2021-09-02 09:02:02 852KB 行业-电子政务-视频分类方法、装

行业-电子政务-视频分类模型训练方法、装置、存储介质及电子设备.zip

2021-09-02 09:02:02 831KB 行业-电子政务-视频分类模型训练

个人信息

热门下载

最新下载

其他资源