基于Pytorch实现的语音情感识别系统
本项目是一个语音情感识别项目,使用多种的预处理方法,使用多种模型,实现了语音情感识别。
使用准备
Anaconda 3
Python 3.8
Pytorch 1.13.1
Windows 10 or Ubuntu 18.04
说明:
RAVDESS数据集只使用Audio_Speech_Actors_01-24.zip
更大数据集数据集有近2.5万条数据,做了数据量均衡的,知识星球也提供了该数据集的特征数据。
准备数据
生成数据列表,用于下一步的读取需要,项目默认提供一个数据集RAVDESS,这个数据集的介绍页面,这个数据包含中性、平静、快乐、悲伤、愤怒、恐惧、厌恶、惊讶八种情感,本项目只使用里面的Audio_Speech_Actors_01-24.zip,数据集,说话的语句只有Kids are talking by the door和Dogs are sitting by the door,可以说这个训练集是非常简单的。下载这个数据集并解压到dataset目录下。