lpc
matlab代码
用于多通道卷积语音/音乐分离的语音密度估计。
我使用独立向量分析(IVA)作为分离框架。
请检查报告以获取详细信息。
请使用来重现报告的结果。
我重写了代码以使其更有条理和有用。
与流行的端到端监督语音分离方法不同,此处的目标是学习用于无监督分离的神经网络密度模型。
所得的密度模型可用于例如在线或批量分离,不同数量来源的分离,人工或实际混合物的分离,而无需重新训练任何不同的特定监督分离模型。
关于Pytorch培训代码
Artificial_mixture_generator.py:实际混合矩阵为inv(a_FIR_system)*(another_FIR_system),因为我们不断更改混合矩阵,并且自然梯度下降对组合的分离混合矩阵起作用。
dnn_source_priors.py:定义了简单的圆形和非圆形源模型。
如果还想恢复每个仓的相位,则必须使用非圆形模型。
恢复相位(直到某些全局旋转歧义)是不平凡的,因为这将使语音反卷积/去杂音化。
这是通过迫使使用估计相位的重构语音也与原始源保持一致来实现的。
尽管如此,轻量级的无记忆圆形模型在大多数情况下似乎已经
2023-04-21 19:42:53
593KB
系统开源
1