DFT的matlab源代码MFCC自动语音识别算法的实现
用于自动语音识别(ASR)的梅尔频率倒谱系数(MFCC)和动态时间规整(DTW)算法的Python
2.7实现。
方法
从.wav文件读取音频数据和采样频率
帧信号
将窗口功能应用于框架(默认值=汉明)
计算帧的DFT
计算每个DFT仓的周期图功率谱密度估计
应用梅尔频率滤波器组进行信号
对每个滤波器内的能量求和,并以10为底的对数
取每个滤波器的DCT
保持系数[1:13]
计算参考向量和输入向量的DTW最佳路径和欧式距离
去做
噪音门
预加重/提升
特征向量数据库
音频记录/播放(
audio.py
)
多线程MFCC提取
创建MFCC提取程序作为类?
2022-05-12 08:40:21
7.83MB
系统开源
1