说话人识别

上传者: u014776775 | 上传时间: 2021-10-23 16:43:41 | 文件大小: 10.64MB | 文件类型: -
目前,大部分的说话人识别模型是基于MFCC的混合高斯模型,MFCC包含语音频率结构的时间变化信息,相对稳定,但不同的说话人之间容易相互模仿,本论文针对MFCC的易模仿性,增加了另一种特征参数,基音周期,基因周期包含了语音频率结构信息,虽然会受到说话人健康状况的影响,但不容易模仿。本文将二者结合用于说话人识别。同时,针对常规直接对高斯混合模型进行解混导致识别速度慢这一缺点,本文提出先用DTW计算语音样本间基音周期的最短距离,再用GMM的方法计算测试样本在得分小的前几个训练样本中分布的最大似然概率。实验表明,这种DTW和GMM相结合的说话人识别模型在提高识别准确率和缩短识别时间上都有着显著性的改进。

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明