基于语音的性别识别 基于语音的性别识别,使用: 免费的ST美国英语语料库数据集(SLR45) 梅尔频率倒谱系数(MFCC) 高斯混合模型(GMM) 数据集 可以在上找到免费的ST美国英语语料库数据集(SLR45) 。 它是提供的免费的美国英语语料库,其中包含10位说话者(5位女性和5位男性)的讲话。 每个说话者大约有350种话语。 理论 语音特征提取 此处使用梅尔频率倒谱系数(MFCC),因为它们可在说话者验证中提供最佳结果。 MFCC通常如下得出: 进行信号(窗口摘要)的傅立叶变换。 使用三角形重叠窗口,将以上获得的光谱的功率映射到mel刻度上。 记录每个梅尔频率下的功率对数。
2021-06-26 02:16:54 18.1MB data-science machine-learning scikit-learn voice
1
GMM_Digital_Voice_Recognition 基于GMM与MFCC特征进行数字0-9的语音识别,GMM,MFCC,语音识别,中文数据,sklearn,scikit-learn,数字语音识别。 预安装 conda create -n GMM -c anaconda python=3.6 numpy pyaudio scipy #也可以使用pip conda activate GMM pip install -r requirements.txt 数据链接: ://pan.baidu.com/s/124TiAs8m7Ioa2_3dUrxGSg提取码:xsfe 以下命令假设下载
1
高斯混合模型聚类(Gaussian Mixture Mode,GMM)是一种概率式的聚类方法,它假定所有的数据样本x由k个混合多元高斯分布组合成的混合分布生成。 使用场景:用于平坦的结合结构,对密度估计很合适
2021-06-17 19:16:43 2KB 高斯 混合 聚类 python
1
使用说明在这里:https://blog.csdn.net/yj13811596648/article/details/88737623
2021-06-15 10:02:02 143.03MB 语音识别 性别识别 GMM
1
这是一篇硕士毕业论文,关于声纹识别的,模型是用的gmm模型,工具用的是htk,应该说很有帮助
2021-06-11 10:40:08 749KB gmm hmm 语音识别 htk
1
采用标准C语言实现:MFCC参数提取,K-means聚类,GMM建模及识别。
2021-06-10 19:36:34 75KB 声纹识别 MFCC GMM
1
GMM(高斯混合模型)的动态背景分割的实验报告以及源码,数据集。 另外用到了形态学操作与多通道的处理,提升了实验结果的性能。
2021-06-07 22:29:20 33.26MB GMM 高斯混合模型 背景分割 源码
1
matlab集成c代码 使用MSR-Idendity-toolkit 做GMM-UBM实验的过程记录 speaker recognitiong using GMM-UBM, implementing on MSR-Idendity-toolkit. 零、准备工作 下载MSR工具包,该工具包是matlab代码,即.m文件,。 下载ALIZE工具包,用于提取HTK格式的MFCC特征,如安装有HTK并会用HTK来提取MFCC特征可忽略, 一、提取MFCC特征 由于MSR工具包需要使用htk格式的mfcc特征,而HTK的安装有点复杂,因此这里直接使用ALIZE3.0工具包提取mfcc特征,ALIZE就是使用HTK的HCopy提取特征的,好处是不用安装HTK就可以直接使用HCopy,直接下载ALIZE工具包编译后即可使用。ALIZE下载地址:;ALIZE 官网地址: 用ALIZE的HCopy工具提取mfcc特征的步骤 所用代码为: bin/HCopy -C cfg/hcopy_VCTK_mfcc.cfg -T 1 -S VCTK_train_htk.scp 代码解释: Hcopy工具包的位置在M
2021-06-07 09:46:34 13.05MB 系统开源
1
入口文件是sharks.m,它提供了软件的图形界面。 MFCC的识别率非常好。
2021-06-01 16:03:09 58KB matlab
1
利用opencv中的高斯模型进行视频的轮廓检测,识别运动物体并计数。 利用opencv中的高斯模型进行视频的轮廓检测,识别运动物体并计数。
2021-06-01 03:45:47 35.63MB GMM
1