上传者: 42125770
|
上传时间: 2021-11-02 15:14:51
|
文件大小: 387KB
|
文件类型: -
介绍
该数据集包含来自10个类别的城市声音的8732个标记的声音摘录(<= 4s):空调,汽车喇叭,儿童玩耍,狗吠,钻探,enginge_idling,gun_shot,手提钻,警笛和street_music。 这些类别是根据城市声音分类法得出的。 有关数据集及其编译方式的详细说明,请参阅我们的论文。 所有摘录均取自上传到现场录音。 这些文件已预先排序为十折(名为fold1-fold10的文件夹),以帮助复制和比较上面文章中报告的自动分类结果。
除声音摘录外,还提供了一个CSV文件,其中包含有关每个摘录的元数据。 数据集链接-https:
方法
1.有3种基本方法可以从音频文件中提取特征:a)使用音频文件的mffcs数据b)使用音频的频谱图图像,然后将其转换为数据点(就像对图像所做的那样)。 使用Librosa的mel_spectogram函数可以轻松完成此操作。c)结合两个功能以构建