言语情感识别
卷积递归神经网络的TensorFlow在IEMOCAP数据库上的语音情感识别(SER)实现。为了解决帧情感标签不确定性的问题,我们执行了三种合并策略(最大合并,均值合并和基于注意力的合并)加权池)以生成SER的发声级功能。 这些代码仅在带有GTX-1080 GPU的ubuntu 16.04(x64),python2.7,cuda-8.0,cudnn-6.0上进行过测试。要在计算机上运行这些代码,您需要安装以下依赖项:
张量流1.3.0
python_speech_features
波
cPickle
麻木
斯克莱恩
操作系统
演示版
要运行演示,请在分叉存储库之后,运行以
1