Pre-trained models are available here. All models are trained on Kinetics-700 (K), Moments in Time (M), STAIR-Actions (S), or merged datasets of them (KM, KS, MS, KMS).
2022-11-25 17:16:22 487.42MB pytorch resnet 3d-resnet 预训练模型
1
为了将可学习的参数从预先训练的2D ResNet-50(ImageNet)传输到3D,我们通过三维复制了2D滤镜(重复复制它们)。 这是可能的,因为视频或3D图像可以转换为图像切片序列。 在训练过程中,我们希望3D ResNet-50学习每个帧中的模式。 该模型具有4,800万个可学习的参数。 只需调用“ resnet50TL3Dfun()”函数。
2022-03-09 21:05:52 129.2MB matlab
1
在下载模型 自述文件正在建设中:)
2021-09-26 15:29:40 19KB Python
1
该模型使用基于磁共振成像 (MRI) 的 ResNet-18 模型检测阿尔茨海默病 (AD)。 在该模型中,我们提出了一种在 3D CNN 中利用迁移学习的方法,该方法允许将知识从 2D 图像数据集 (ImageNet) 迁移到 3D 图像数据集。 为了构建 3D ResNet-18,2D ResNet-18 的 2D 过滤器在第三维中扩展为具有 3D 过滤器。 其余层根据新过滤器进行了调整。 然后,将整个 MRI 用于训练 3D ResNet-18,以对每个人做出一个决定。 我们的结果表明,将转移学习引入3D CNN可以提高AD检测系统的准确性。 这种方法在我们的 ADNI 数据集上实现了 96.88% 的准确度、100% 的灵敏度和 93.75% 的特异性。 此文件夹中目前有一些示例图像。 要访问更多图像,您需要将您的应用程序发送到 ADNI ( http://adni.loni
2021-09-17 12:35:57 118MB matlab
1
使用3D ResNet进行视频分类 这是使用训练的3D ResNet进行视频(动作)分类的pytorch。 在Kinetics数据集上训练了3D ResNet,该数据集包括400个动作类。 此代码将视频用作输入,并在得分模式下输出每16帧的班级名称和预测班级得分。 在功能模式下,此代码每16帧输出512个暗角的功能(在全局平均池化之后)。 提供此代码的Torch(Lua)版本。 要求 conda install pytorch torchvision cuda80 -c soumith FFmpeg,FFprobe wget http://johnvansickle.com/ffmpeg/
2021-09-13 16:24:53 154KB python computer-vision deep-learning pytorch
1
用于动作识别的3D ResNet 这是以下论文的PyTorch代码: 该代码仅包括对ActivityNet和Kinetics数据集的培训和测试。 如果您想使用我们的预训练模型对视频进行分类,请使用。 提供了此代码的PyTorch(python)版本。 PyTorch版本包含其他模型,例如预激活ResNet,Wide ResNet,ResNeXt和DenseNet。 引文 如果您使用此代码或预先训练的模型,请引用以下内容: @article{hara3dcnns, author={Kensho Hara and Hirokatsu Kataoka and Yutaka
2021-03-02 19:13:22 24KB computer-vision lua deep-learning torch7
1