在本文中,我们提出了一种基于概率混合模型分解的方法,该方法可以同时识别乐器类型,估计音高并将每个音高分配给包含多个音源的单声道复音音频。 在提出的系统中,将观察到的混合音符的概率密度函数(PDF)视为所有可能音符模型的加权和近似值。 这些音符模型涵盖了14种乐器及其所有可能的音高,并根据概率描述了它们的动态频率包络线。 表示特定类型乐器音高存在概率的权重系数是使用最大期望(EM)算法估算的。 权重系数用于检测源乐器的类型和音高。 涉及在指定的音高范围F3-F6(37个音高)内的14台乐器的实验结果显示出良好的辨别能力,尤其是在乐器识别和乐器音高识别方面。 对于包括音符起音检测工具的整个系统,使用四重和弦录音,乐器音高识别,乐器识别和音高估计的平均F测量值分别为55.4、62.5和86%。
1