DSP 语音识别程序 DTW MFCC,嵌入式平台语音识别源码
2021-10-25 21:18:47 158KB DSP 语音识别程序 DTW MFCC
1
C++声音特征提取,调用opensmile的API对音频文件进行特征提取。 程序包括一个封装SMILEapi.dll的动态库和一个测试程序。 代码由VS2015编写。
2021-10-23 09:10:03 1.33MB 声音特征提取 opensmile mfcc SMILEapi.dll
1
压缩包中包含20个标准测试语音,分为两组,一组10个,7个.m文件,是在matlab下运行的。程序提取了语音的MFCC参数,通过DTW算法进行模板匹配,比较了两组语音模板的距离。最后识别出距离最小的就是相同的语音。
2021-10-21 21:37:52 433KB DTW 语音识别 MFCC Matlab
1
几种改进的MFCC特征参数提取方法,mfcc
2021-10-13 14:23:25 292KB MFCC
1
在多数的现代语音识别系统中,人们都会用到频域特征。梅尔频率倒谱系数(MFCC),首先计算信号的功率谱,然后用滤波器和离散余弦变换的变换来提取特征。本文重点介绍如何提取MFCC特征。 首先创建有一个Python文件,并导入库文件:     from scipy.io import wavfile     from python_speech_features import mfcc, logfbank     import matplotlib.pylab as plt1、首先创建有一个Python文件,并导入库文件:     from scipy.io import wavfile     f
2021-10-09 13:11:07 388KB mfcc python 特征
1
主要是运用mfcc提取,源程序有些长,看的晕晕的,有看懂的望指教一二。
2021-09-27 17:19:13 10KB mfcc
1
用Python语言写的语音的MFCC特征提取代码,用于机器学习、深度学习等音频分类,语音识别,语音情感识别等领域
2021-09-07 14:38:57 51KB Python
1
今天小编就为大家分享一篇对python中Librosa的mfcc步骤详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2021-09-07 11:30:51 69KB python Librosa mfcc
1
音乐分类 Matlab工具使用MFCC和K最近邻居算法将音乐分为4种类型。 输入是带有.mp3 / .wav扩展名的音频文件。 ##问题陈述 通过使用监督学习的概念将音频信号分类为不同的预定义流派。 背景技术虽然音乐令人愉悦,但如今互联网上提供的大量内容使音乐的分类成为必然的任务。 音乐以无限的形式出现。 也称为流派。 尽管音乐涵盖了如此广泛的类别,但是某些特征是所有人共有的,而与节奏,艺术家,乐谱等无关。因此,基于特征提取技术,可以将使用的音乐缩减为一组数据点。 ## Dataset在我们之前的摘要中,我们详细介绍了三个不同的数据集,这些数据集都适合我们的机器学习问题。 在这些数据集中,考虑到数据集的大小以及数据集中可用的音频文件的类型后,我们使用GTZAN流派集合作为我们的训练数据集。 我们仅使用现有数据集是因为其具有标准化的性质。 由于问题的性质,创建我们自己的数据集是一项艰巨的
2021-08-27 10:19:29 5.22MB MATLAB
1
【语音识别】基于MFCC的GMM实现语音识别matlab源码.md
2021-08-24 09:17:31 19KB 算法 源码
1