matlab倒错代码MFCC处理数字识别系统
这是华盛顿大学电气工程
DSP
集中的
Capstone
项目。
字幕:
神经网络;
机器学习;
MFCC;
语音识别;
音频分类;
细节:
它是一个实时音频数字识别系统。
它包含
2500
个用于训练和测试的音频数据,1500
个来自公共数据集,100
个来自大学志愿者。
为了处理输入音频的不同音量和长度,我使用了梅尔频率倒谱系数(MFCC)来提取输入音频的特征,成功地将数据维度减少了
1
到
34,同时保持了频率网络训练的特征。
最后,我为训练部分实现了前馈神经网络,并对其进行了微调以获得良好的结果。
结构体:
这个Repo主要包含两部分代码:
Matlab
代码用于计算音频信号的
MFCC。
Python
代码是前馈神经网络的实现。
2022-11-04 11:37:56
72.78MB
系统开源
1