上传者: 42099936
|
上传时间: 2021-10-26 09:21:02
|
文件大小: 13KB
|
文件类型: -
重新思考音频分类的CNN模型
该存储库包含我们的论文《的PyTorch代码。 在以下三个数据集上进行了实验,这些数据集可以从提供的链接中下载:
前处理
预处理是单独进行的,以节省模型训练期间的时间。
对于ESC-50:
python preprocessing/preprocessingESC.py --csv_file /path/to/file.csv --data_dir /path/to/audio_data/ --store_dir /path/to/store_spectrograms/ --sampling_rate 44100
对于UrbanSound8K:
python preprocessing/preprocessingUSC.py --csv_file /path/to/csv_file/ --data_dir /path/to/audio_data/ --