DCASE 2019-任务5-城市声音标记
该存储库包含我用于的最终解决方案。 该模型在粗略和精细级别标签的预测中均排名第一。
再现结果
先决条件:
基于Linux的系统
Python> = 3.5
拥有至少8GB内存的NVidia GFX卡
CUDA> = 10.0
已安装virtualenv软件包
复制:
克隆此存储库。 要使用单个命令复制整个解决方案,请在存储库目录中时执行make run_all命令。 该命令按顺序执行以下步骤:
make env :在当前目录中创建虚拟环境
make reqs :安装python软件包
make pytorch :安装PyTorch
make download :从Zenodo下载Task 5的数据
make extract :提取压缩文件
make parse :解析注释
make logmel :计算并保存所有文件的Log-Mel频
1