DFT的matlab源代码基于语音的登录系统
此项目使用语音作为度量标准,以根据从梅尔频率倒谱系数(MFCC)获得的系数训练的高斯混合模型(GMM)模型来授权登录
训练
首先清洁语音样本,以消除不必要的噪音。
为每个样本计算MFCC,然后进行离散傅立叶变换(DFT)和对数变换,GMM使用数据将基于MFCC值的语音样本进行聚类。
部署方式
该项目在Django上运行。
Web界面提示用户讲话。
然后,将录制的语音与训练有素的GMM模型进行匹配,以找到适合的最佳群集。
如果匹配高于某个阈值(例如90%),则授权用户。
改进之处
必须注意降低噪音
从录音中区分出实际声音
更好地了解GMM和制造的集群(集群的可视化)
增强模型训练(具有更多数据集)
尝试为MFCC使用不同的过滤器值
2022-12-06 13:49:18
267.82MB
系统开源
1