卡尔迪戈普
该项目使用Kaldi计算基于GMM的GOP(发音优度)。
有关基于DNN的实现的说明
此实现是基于GMM的。 对于基于DNN的实现,请检查Kaldi的官方存储库:
GOP-DNN的性能应该比GOP-GMM好得多。
如何建造
./build.sh
运行示例
cd egs/gop-compute
./run.sh
理论
在传统的基于GMM-HMM的系统中,GOP最早是在(Witt等,2000)中提出的。 它被定义为后验的持续时间标准化对数:
$$ GOP(p)= \ frac {1} {t_e-t_s + 1} \ log p(p | \ mathbf o)$$
其中$ \ mathbf o $是输入观测值,$ p $是规范电话,$ t_s,t_e $是开始和结束帧索引。
假设对于任何$ q_i,q_j $,$ p(q_i)\ p(q_j)$,我们有:
$$ \ lo
1