随着“平安城市”建设的不断推进,公共安全逐渐成为人们关注的热点间 题,税频监控技术也随之得到了越来越广泛的应用,传统的视频监控系统主要提供采集存储功能,这远远无法满足人们对其智能化的需求。要实现智能化的视频监控系统,以下几个关键问题亟需解决:(1)如何快速发现监控视频中的异常行为,及时给出警报,并最大限度地减少误报和漏报现象;(2)如何在多种不利因素下(如羊样本,低分辨率)对可疑目标进行准确的识别分析:(3)在海量数据的情况下,如何确保视频分析系统的实时性及准确性。 近年来,深度学习在机器视觉、语音识别和自然语言处理等多个领域都取得了优异的成绩,这也为智能视频分析技术的发展带来了新的契机。因此,本文基于深度学习的方法对上述相关问题展开研究,主要研究工作与创新如下: 1,针对监控视频中的异常行为尤其是暴力打斗行为难以准确快速发现的问题,提出了一种基于三维卷积深度网络的暴力检测方法。该方法利用大量带标签的视频数握进行有监督的学习,通过将传统二维卷积核扩展为三维来提取视颈中的运动信息,然后综合利用视频的空间信息及运动信息来构建深度神经网络模型,从而实现对监控视须中暴力打斗的检测。由于深层模型端到端学习的特性,所以不需要设计复杂的手工特征来描述运动信息,从而降低了任务的复杂度。实验结果表明,本文提出的方法在单一场景以及人群密集环境下都可以对暴力打斗行为进行准确识别。 2.针对人脸图像在单训练样本下难以被准确识别的问题,提出了一种基于核主成分分析网络(Kernel Principle Component Analysis Setworks,KPCANet)模型的二阶段投票人脸识别方法。该方法在不使用额外样本数据的情况下,利用非监督深层模型KPCANet对分块后的人脸图像进行训练并利用KPCA学习得到的波器进行特征提取,从而保证了提取的特征对光照及遮挡的鲁棒性,同时也消除了人脸局部形变对识别率的影响。本文通过投票的方法融合每一个分块的预测值来得到最后的识别结果,对于单次投票结果不唯一的情况,本文采取了二阶段的投票方法,通过扩大每一块的预测候选集,并对不同的区域赋子不同的权值来得出最后的结果,从而进一步提升了识别的准确率。实验结果表明,该方法在四个公开人脸数据集上都取得了优异的表现,算法准确率优于使用了额外数据集的通用方法,尤其是在非限制人脸数据集LFW-a上,本文提出的方法比sVDL和LGR方法准确率提升了约15%.
1
随着“平安城市”建设的不断推进,公共安全逐渐成为人们关注的热点问题,视频监控技术也随之得到了越来越广泛的应用。传统的视频监控系统主要提供采集存储功能,这远远无法满足人们对其智能化的需求。要实现智能化的视频监控系统,以下几个关键问题亟需解决:(】)如何快速发现监控视频中的异常行为,及时给出警报,并最大限度地减少误报和漏报现象;(2)如何在多种不利因素下(如单样本,低分辨率)对可疑目标进行准确的识别分析;(3)在海量数据的情况下,如何确保视频分析系统的实时性及准确性。
2022-04-24 09:06:37 23.08MB 深度学习 音视频 人工智能
1
视频中自动暴力检测的数据集 该存储库包含350个分别标记为“非暴力”和“暴力”的视频剪辑,用于训练和测试用于检测视频中暴力的算法。 专门记录了非暴力剪辑,包括由于快速移动和与暴力行为的相似性而在暴力检测任务中导致误报的行为(拥抱,拍手,狂喜等)。 资料说明 数据集分为两个主要目录,“非暴力”和“暴力”,将包含的剪辑标记为分别显示非暴力行为和暴力行为。 violence-detection-dataset ├─ non-violent │ ├─ cam1 (60 .mp4 clips) │ └─ cam2 (60 .mp4 clips) └─ violent ├─ cam1 (115 .mp4 clips) └─ cam2 (115 .mp4 clips) 目录分为两个子目录“ cam1”和“ cam2”: “非暴力/ cam1”包括60
2021-09-23 15:44:50 1.02GB
1
VioAudio数据集包含100个暴力音频数据以及100个非暴力音频数据。原始数据来源于MediaEval2012中的电影音频。该数据集的构建是为了比较在听觉通道各个算法的优劣。特别注意的是,非暴力音频包含的情况有 打斗声、尖叫声、撞车声和爆炸声等等。
2019-12-21 19:58:17 10.18MB 暴力检测 暴力音频检测 VioAudio
1