本论文中把语音进行数字化。在对其进行传输、存储和识别。本论文中按照预处理、特征提取、训练和识别等四个方面的方法来对语音信号进行重点处理。而这其中预处理与特征提取是最为重要的。为了完成以上处理,本人运用了MATLAB R2014a开发工具以及GUI用户界面开发和数据计算能力。使用VQ模型作为训练辩别的方法,利用MFCC提取特征,使用k-means算法建立码库,最后完成说话人识别小型的系统。
2021-12-23 17:09:54 477KB 语音信号 MATLAB 说话人识别
1
职能: 选择图像序列:读取图像序列 将选定的图像序列添加到数据库:将输入图像序列添加到数据库并将用于训练数据库信息:显示有关数据库中存在的图像序列的信息。 步态识别:步态识别。 处理选定的输入图像序列 删除数据库:从当前目录中删除数据库 程序信息:显示有关此软件的信息
2021-12-11 12:46:54 14.87MB matlab
1
微软开源说话人识别matlab代码工具包
2021-12-06 13:11:53 48.65MB 说话人识别
1
使用VQ适量量化对说话人进行识别,并成功应用到门禁识别领域,该程序使用matlab GUI界面开发,根据人声实现说话人的确认,然后对门禁系统进行开锁,目前可以实现添加说话人、删除说话人等一系列操作。与我的博客(基于VQ矢量量化的说话人识别(应用于门禁识别)是配套的)希望可以帮助到大家。
2021-12-04 13:00:24 42.74MB 说话人识别 门禁识别 VQ矢量量化
1
这是 Python3 的 VoiceID 端口。 原始版本在这里: : 。 VoiceID 是一个用 Python 编写的说话人识别/识别系统,基于 LIUM Speaker Diarization 框架。 VoiceID 可以对视频或音频文件进行处理,以识别在哪个时间片有人说话(diarization); 然后它检查所有这些段以确定谁在说话。 为此使用语音模型数据库。
2021-11-27 19:42:37 4.94MB Python
1
用matlab实现说话人的识别,有具体的例子和代码,还有做界面的参考资料。
2021-11-22 11:29:38 1.19MB 说话人识别
1
语音识别(Speech Recognize)技术,是让机器通过识别和理解过程使之听懂人类语言的技术。语音识别技术是信息技术中人机交互的关键技术,目前已经在呼叫中心、电信增值业务、企业信息化系统中有了广泛的应用。 InterReco电话语音识别产品整合了科大讯飞研究院、中国科技大学讯飞语音实验室以及清华大学讯飞语音实验室在语音识别上多年的技术成果,并针对中文语音识别应用做了多层面的优化,核心技术上达到了国际领先水平。
1
目前,大部分的说话人识别模型是基于MFCC的混合高斯模型,MFCC包含语音频率结构的时间变化信息,相对稳定,但不同的说话人之间容易相互模仿,本论文针对MFCC的易模仿性,增加了另一种特征参数,基音周期,基因周期包含了语音频率结构信息,虽然会受到说话人健康状况的影响,但不容易模仿。本文将二者结合用于说话人识别。同时,针对常规直接对高斯混合模型进行解混导致识别速度慢这一缺点,本文提出先用DTW计算语音样本间基音周期的最短距离,再用GMM的方法计算测试样本在得分小的前几个训练样本中分布的最大似然概率。实验表明,这种DTW和GMM相结合的说话人识别模型在提高识别准确率和缩短识别时间上都有着显著性的改进。
2021-10-23 16:43:41 10.64MB matlab
1
基于Alize的ivector算法,《声纹识别之Alize入门教程(三):I-vector》对应资源。https://blog.csdn.net/u012594175/article/details/88726163
2021-10-23 11:51:38 28.66MB 声纹识别 说话人识别 ivecto alize
1