音频信号的情感识别
这是使用OpenSmile,主成分分析和Scikit-learn库中的分类器从Surrey视听表达情感(SAVEE)数据库中的音频信号进行情感识别的一组灵感。 SAVEE数据库是由萨里大学(University of Surrey)的四名以英语为母语的男性说话者(分别为DC,JE,JK,KL),研究生和研究人员记录的,该数据库包括7种不同情绪的录音和480种英国英语发音。
OpenSmile用于从.wav文件中提取特征,它会生成1582个特征。 之后,我将PCA(主成分分析)用于减少三维。 最后,我使用了不同的算法进行分类。
不同的情感是:
Anger
Disgust
Fear
Happiness
Sadness
Surprise
Neutral
结果
算法
模型表现
多层感知器分类器
0.8020833333333334
Logistic回归+ lbfgs解算器
2021-11-14 22:01:51
3.4MB
Python
1