motion_detection_cpc
此存储库提供了使用语音作为输入的情感识别系统的代码。 通过使用对比预测编码(CPC)训练的自我监督表示,可以提高性能。 使用CPC时,结果的准确度从71%的基线提高到80%,这是30%的相对显着误差降低。
博客在这里: :
初始设置
安装依赖项
virtualenv -p python3.7 venv
source venv/bin/activate
make deps
下载资料
wget https://zenodo.org/record/1188976/files/Audio_Speech_Actors_01-24.zip $HOME/RAVDESS/Audio_Speech_Actors_01-24.zip
unzip $HOME/RAVDESS/Audio_Speech_Actors_01-24.zip
创建训练,验证和测试数据
1