上传者: 38618024
|
上传时间: 2021-04-09 13:06:20
|
文件大小: 180KB
|
文件类型: PDF
目录
摘要:
数据集描述:
模型构建
结果分析
结束
相关链接:
摘要:
语音情感分析就是将音频数据通过MFCC(中文名是梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients))加载为特征向量形式,然后将其输入进入LSTM神经网络进行抽取语音特征。最后采用softmax分类函数实现情感标签的分类任务。其下游任务是人机交互智能化的一个关键部分。
数据集描述:
一共四种中文情感的数据集。共200条,数据质量不是很好,不是很长的语音文本,但是从这种4s短时的语音中也能听出其情感极性。其数据存储格式为:***.wav ,为wav文件。这个小的demo数据集来