上传者: 42170790
|
上传时间: 2021-12-10 15:26:52
|
文件大小: 55.29MB
|
文件类型: -
使用CNN进行动作识别
在该项目中,对卷积神经网络(CNN)进行了训练,以使用Pytorch对图像和视频进行分类。
数据集
使用过的UCF101数据http://crcv.ucf.edu/data/UCF101.php但仅接受了10个班级(共101个班级)。 每个剪辑有3帧,每帧为64 * 64像素。 片段的标签位于q3_2_data.mat 。 trLb是训练剪辑的标签,而valLb是验证剪辑的标签。
首先对CNN进行训练以对每个图像进行分类。 然后,使用3D卷积训练CNN,将每个剪辑分类为视频而不是图像
Kaggle比赛
CNN对图像的动作识别-排名第10- http://www.kaggle.com/c/cse512springhw3
CNN对视频的动作识别-排名32- http://www.kaggle.com/c/cse512springhw3video