上传者: 42126749
|
上传时间: 2021-11-16 14:56:16
|
文件大小: 1.16MB
|
文件类型: -
VRCNet-Pytorch
G. Bezirganyan,K。Muradyan撰写的论文“使用基于U-Net的体系结构进行语音分离”的实现。
数据集
该存储库使用musdb数据集进行训练和评估。 数据集是免费的,但需要访问。 要下载和进一步使用数据集,请查看网页。
楷模
这里介绍的模型基于架构。 主要区别在于编码层。 对于VggUNet,编码层是的编码部分,ResUNet使用ResNet18的编码部分,而VRCNet同时使用和ResNet18的两个编码层。 下图总结了本文中描述的所有三个模型:VggUNet,ResUNet和VRCNet(从左到右)。
在模型文件夹中,我们还有论文(SCUNet)的实现,以及VRCNet的修改版本:VCNet。
准备
该存储库被简化为musdb数据集,并要求将其下载并保存在方便的文件夹中。 还需要进行预处理,因为在每次迭代中读取音频文件可能需要大量时间