使用LSTM进行音频分类
使用基于LSTM的模型对城市声音音频数据集进行分类。
要求
pytorch == 1.0.1
scipy == 1.2.0
火炬视觉== 0.2.1
熊猫== 0.24.1
numpy == 1.14.3
torchaudio == 0.2
librosa == 0.6.3
pydub = = 0.23.1
按照测试数据进行测试的步骤
在当前目录中创建一个名为data / test的文件夹,其中将包含所有要测试的“ .wav”文件。
从此下载“ bestModel.pt”,并将其放置在当前目录中。
运行以下命令:
python preprocess.py
python eval.py
将会在当前目录中生成一个名为“ test_predictions.csv”的csv文件,其中包含所有测试文件及其相应的预测标签。
团队
阿尼什·马丹(Anish
1