本工程采用vc++6.0编写的MFC工程,开发了一个GUI界面。特征提取采用MFCC算法,识别部分采用的是VQ识别算法,很辛苦才编出来的,希望能给大家带来帮助。 不能运行不要积分喔!
2021-05-26 15:04:07 4.7MB MFCC VQ
1
在语音信号处理中,常用的语音特性是基于Mel频率的倒谱系数(MFCC)以及一些语音信号的固有特征,如共振峰和基音频率等。倒谱可以较好地将语音信号中的激励信号和声道响应分离,并只需要用十几个倒谱系数就能较好地描述语言信号的声道响应,在语音信号处理中占有很重要的位置。本论文设计了基于倒谱的语音特性参数提取算法,并在Matlab中予以实现。
2021-05-23 20:29:57 813KB 倒谱 MFCC 基音 共振峰
1
在语音识别系统中,特征参数提取尤为重要,Mel倒谱参数(MFCC)算法是将语音从时域变换到倒谱域上,MFCC能更充分地描述了人耳听觉系统非线性地特点,性能上要明显优于之前的LPCC。
2021-05-23 15:03:44 859B Matlab MFCC算法
1
老外实现的信号处理算法库 1.Various input signal sources 2.Windowing and filtering 3.FFT-related transformations 4.Feature extraction (including MFCC and HFCC) 5.Pattern matching using Dynamic Time Warping (DTW)
2021-05-13 16:25:47 245KB 语音识别 MFCC DTW FFT
1
想学习mfcc是如何计算获得,并用代码实现(该项目是tensorflow提供的语音唤醒例子下) 而tensorflow1 中两步获取mfcc,只能获取到中间语谱图(spectrogram)变量, 而当我想要获取mfcc计算过程中的加窗、梅尔滤波器等的相关信息,是极难获取的,需要很强的代码功底。最近刚好在学习tensorflow2 ,就用tf2 手动实现了分步骤提取出mfcc的过程
2021-05-13 15:21:46 6KB mfcc tensorflow2
1
MFCC特征提取过程: 1)先对语音进行预加重、分帧和加窗: 2)对每一个短时分析窗,通过FFT得到对应的频谱; 3)将上面的频谱通过Mel滤波器组得到Mel频谱; 4)在Mel频谱上面进行倒谱分析
2021-05-11 15:31:38 607KB MFCC
1
端点检测 -预加重- fourier变换定义 -取成一维语音数据 -MFCC 神经网络部分-
2021-05-09 21:48:47 27KB 说话人识别代码
1
输入一个wav文件,可对其pitch mfcc特征进行提取
2021-05-09 14:20:33 1.57MB mfcc pitch
1
MFCC得到乐器音频信号的短时功率谱;再得到乐器音频信号的短时过零率;与原乐器音频信号——同一类乐器音频信号的各个特征谱(图)相比较初步判断出该音频属于什么乐器;利用DTW(动态时间归整)比较各类乐器的MfCC和短时过零率的匹配距离数据,判断音频属于什么乐器
1
输出MFCC特征参数为二维数组,行数表示帧数,12列表示12个MFCC特征参数
2021-04-27 09:05:33 3KB python MFCC 语音识别
1