语音质量评价matlab代码深度转换
深度卷积神经网络用于音乐源分离
该存储库包含用于数据生成,预处理和特征计算的类,可用于训练具有不适合内存的大型数据集的神经网络。
此外,您可以从中找到用于查询乐器声音样本的类。
在“示例”文件夹中,您可以找到上述类的使用案例,以了解音乐源分离的情况。
我们提供用于特征计算(STFT)和用于训练卷积神经网络以进行音乐源分离的代码:使用数据集iKala数据集唱歌语音源分离,使用DSD100数据集进行语音,低音,鼓分离,用于大鼓,单簧管,萨克斯风和小提琴的编码。
当原始分数可用时,后面的例子是使用RWC乐器声音数据库中的乐器样本训练神经网络的好例子。
在“评估”文件夹中,您可以找到基于Matlab的代码来评估分离质量。
为了训练神经网络,我们使用和。
我们使用已经训练有素的模型来完成不同任务,提供分离代码。
在examples
/
dsd100
/
separate_dsd.py中将音乐分离为人声,贝斯,鼓和伴奏:
python
separate_dsd.py
-i
-o
-m
<path_to_model
2023-04-12 18:06:06
211KB
系统开源
1