人脸表情会受到姿势、物体遮挡、光照变化以及人种性别年龄等因素的影响,需要卷积神经网络更有效准确地学习特征。AlexNet在表情识别中准确率不高,对输入图像尺寸有限制,针对这些问题,提出了改进AlexNet网络的人脸表情识别算法。在AlexNet网络中引入多尺度卷积更加适用于小尺寸的表情图像,提取出不同尺度的特征信息,并在把多个低层次特征信息在向下传递的同时与高层次特征信息进行跨连接特征融合,从而可以更加完整准确地反映图像信息,构造出更准确的分类器。跨连接会产生参数爆炸,导致网络训练困难,影响识别效果,因此利用全局平均池化对低层次特征信息进行降维,可减少跨连接产生的参数和过拟合现象。本文算法在CK+、JAFFE数据库上的准确率分别为94.25%和93.02%。
2023-04-14 14:12:14 4.26MB 图像处理 图像分类 表情识别 AlexNet
1
介绍 基于深度卷积神经网络实现的人脸表情识别系统,系统程序由Keras, OpenCv, PyQt5的库实现,训练测试集采用fer2013表情库。 主要功能 (1)可以通过从本地图片导入系统,或者直接相机进行拍摄等方法对图片和视频进行处理并分析。 (2)可以切换模型对图片进行处理。 实现原理 (1)表情库的建立 目前,研究中比较常用的表情库主要有:美国CMU机器人研究所和心理学系共同建立的Cohn-Kanade AU-Coded Facial Expression Image Database(简称CKACFEID)人脸表情数据库;fer2013人脸数据集等等,这里我们的系统采用fer2013人脸数据集。 (2)表情识别: ①图像获取:通过摄像头等图像捕捉工具获取静态图像或动态图像序列。 ②图像预处理:图像的大小和灰度的归一化,头部姿态的矫正,图像分割等。(改善图像质量,消除噪声,统一图像灰度值及尺寸,为后序特征提取和分类 识别打好基础) (3)特征提取:将点阵转化成更高级别图像表述—如形状、运动、颜色、纹理、空间结构等,?在尽可能保证稳定性和识别率的前提下,对庞大的图像数据进 行降维
2023-04-11 16:16:23 12.01MB 软件/插件 数据集 keras opencv
1
智能优化算法、神经网络预测、信号处理、元胞自动机、图像处理、路径规划、无人机等多种领域的Matlab仿真代码
2023-04-08 09:45:37 1.8MB
1
详细信息见博文:https://blog.csdn.net/GUA8122HOU/article/details/126168609 人脸表情的数据集和自己训练出来yolov5模型以及基于PYQT5运行yolov5的交互界面 包括源代码和模型,数据集见博文网盘自取。
2023-03-24 11:38:30 59.65MB 交互 表情识别 YOLOV5
1
基于VGGNet卷积神经网络的表情识别。
2023-03-15 07:29:20 167KB 研究论文
1
表情识别数据集,共有7种表情,分别对应于数字标签0-6,具体表情对应的标签和中英文如下:0 anger 生气; 1 disgust 厌恶; 2 fear 恐惧; 3 happy 开心; 4 sad 伤心;5 surprised 惊讶; 6 normal 中性。
2023-03-01 16:22:28 96.59MB 表情识别 CV
1
毕设人脸表情数据集_喜怒哀乐惊讶带voc和yolo标签.zip 毕设用的数据集图片,自己收集标注,voc和yolo格式标签
2023-02-28 10:58:34 14.28MB 表情识别 yolo算法 表情数据集 voc格式
1
微信小程序云开发:大创+表情识别+日记记录+颜值测评+查询心情汇总
2023-01-05 19:20:31 780KB 小程序
1
JAFFE人脸表情数据集由10位日本女性在实验室条件下摆拍指定表情(开心、悲伤、惊讶、害怕、厌恶、生气、中立)获得。共213张图片,每个人每种表情大概3-4张图片,每张图片分辨率为256*256像素。
1
基于SVM多特征融合的微表情识别python源码+项目说明.zip 将上述文件与main.py放在同一目录下,直接运行main.py: a. 从同目录下的CASME II文件夹中提取数据,文件夹的结构为CASME II/subject_name/ep_name/image b. 程序所需文件在CASME II文件夹下,分别为CASME2.xlsx, shape_predictor_68_face_landmarks.dat, UniformLBP8.txt c. 程序将CASME II中第一个表情的第一张图片作为标准面部图像,对所有图像序列进行裁剪与配准,得到192*192的图像序列 d. 将配准后的结果存入result/lwm_result.npy中 e. 随后程序对图像序列进行动作放大,其中放大频率区间为[0.2Hz, 2.4Hz], 放大因子为8 f. 随后对图像序列进行时序插值,目标帧数为10帧 g. 随后对图像序列提取LBP-TOP、3DHOG、HOOF特征,存放于result/features/LBP_feature.npy (或HOG_feature.npy, HOOF_