波网
实现,用于音频源分离。
对于(改进的)Pytorch版本,请单击。
对于Tensorflow 2 / Keras中的第三方实施(不是我本人),请单击。
听的例子
听人声的分离结果和多仪器分离结果
什么是Wave-U-Net?
Wave-U-Net是一种适用于音频源分离任务的卷积神经网络,直接在原始音频波形上工作,中。
Wave-U-Net是U-Net架构对一维时域的一种改编,可以执行端到端音频源分离。 通过一系列涉及一维卷积的下采样和上采样块以及下采样/上采样过程,可以在抽象和时间分辨率的多个尺度/级别上计算特征,并进行组合以进行预测。
有关网络体系结构的摘要,请参见下图。
参加SiSec分离竞赛
Wave-U-Net还以提交和的参加了,并取得了良好的性能,特别是考虑到我们使用的数据集与许多其他提交相比所使用的有限数据集,尽管端到端数据处理更为耗时(我们还必须从数据中学习频
1