基于matlab的的说话人识别系统,加入了添加噪声的选项,测试准确率 读取文件路径方便修改,数据库文件夹格式:speaker\speech_1,speech_2... speaker2\speech_1,speech_2... 对各文件名无要求,程序为顺序读取 具有很高的识别率,欢迎大家使用
2022-04-20 09:06:59 1.17MB matlab GMM 说话人识别 MFCC
1
invMFCCs 是一种解决 Mel 频率倒谱分析逆问题的简单方法,它直接从 Mel 频率倒谱系数 (MFCCs) 中恢复语音波形。
2022-04-07 14:37:25 228KB matlab
1
MFCC-MEL域倒谱系数,是基于人耳听觉特性的特征参数,在语音识别、音频分类检索等领域有广泛应用;
2022-03-25 15:43:36 3KB MFCC
1
opensmile提取MFCC所需要的配置文件,(经过修改后的conf文件)
2022-03-21 13:48:11 5KB 提取mfcc
1
对于美尔倒谱系数进行详细的介绍,以及提供了用Matlab提取美尔倒谱系数的方法。
2022-03-15 15:33:33 115KB MFCC
1
主要为大家详细介绍了梅尔倒谱系数(MFCC)实现,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
2022-03-10 21:26:27 57KB 梅尔倒谱系数 MFCC
1
语音识别相关资料,详细描述了语音识别的具体细节。是比较好看的资料.用的方法包括hmm。dtw 。mfcc等。是语音识别系统的设计文档
2022-03-08 21:00:07 5.93MB 语音识别
1
语音识别使机器可以通过识别和理解过程将语音信号转换为文本。 提取特征,预测最大可能性并生成输入语音信号的模型被认为是配置自动语音识别系统(ASR)的最重要步骤。 本文利用MATLAB建立了一个自动阿拉伯语语音识别系统,并从19位阿拉伯语母语使用者中记录了24个阿拉伯语单词Consonant-Vowel Consonant-Vowel Consonant-Vowel(CVCVCV),每个说话者说出同一单词3次(共1368个单词) )。 为了测试该系统,通过将语音信号划分为约0.25秒的帧和0.10秒的偏移,提取了39个特征。 在后端,通过将特征分成4到10之间的状态数来生成统计模型,每个状态具有8高斯分布。 数据具有48 k采样率和32位深度,并以wave文件格式单独保存。 该系统接受了语音丰富而均衡的阿拉伯语语音列表训练(10个发言人* 3次* 24个单词,总共720个单词),并使用另一个单词列表(24个词语* 9个发言人* 3次*,总共648个单词)进行了测试。 使用不同说话者的相似单词,系统获得了非常好的单词识别准确度结果,为92.92%,单词错误率(WER)为7.08%。
2022-03-08 20:54:24 549KB 行业研究
1
go.m为主程序。 本算法是基于Mfcc和Gmm的说话人识别,test文件夹中的语音数据来自于实验室的陈蕴谷、梁建娟、胡业刚、熊可、颜小运的真实语音。 部分程序采用的是台湾张智星先生编写的sar和dcpr工具箱,在此表示感谢。
2022-03-08 15:44:57 1.13MB MATLA 说话人识 gm
1