提取均值信号特征的matlab代码两个扬声器的基于
LSTM/BLSTM
的
PIT
在多通话者混合语音分离和识别方面取得的进展,通常被称为“鸡尾酒会问题”,并没有那么令人印象深刻。
尽管人类听众可以很容易地感知混合声音中的不同来源,但对于计算机来说,同样的任务似乎极其困难,尤其是当只有一个麦克风记录混合语音时。
1.
运行性能
注意:训练集和验证集包含通过从
WSJ0
集中随机选择说话者和话语生成的两个说话者混合,并以
-2.5
dB
和
2.5
dB
之间统一选择的各种信噪比
(SNR)
混合它们.
对于LSTM
,不同性别的混合音频结果如下:
对于BLSTM
,不同性别的混合音频结果如下:
从上面的结果可以看出,混合性别音频的分离效果优于同性音频,BLSTM
的性能优于
LSTM。
2.
评价标准
SDR:信号失真比
SAR:信号与伪像的比率
SIR:信号干扰比
STOI:短期客观可懂度测量
ESTOI:扩展的短期目标可懂度测量
PESQ:语音质量的感知评估
3.
依赖库
matlab(我的测试版:R2016b
64位)
tensorflow(我的测试版本:1.4.0)
anac
2022-12-21 11:33:49
5.37MB
系统开源
1