语音识别通过CNN 孤立词语音识别,复旦大学计算机科学技术学院数字信号处理期末项目 介绍 此仓库实现了一个强大的语音识别系统,该系统可以识别20个单独的单词,例如“语音”,“北京”,“文件”等。它利用从原始语音中提取的梅尔频谱特征,将频谱视为图片,卷积神经网络被用来对它们进行分类。 详细中文介绍请参考课程报告。 怎么玩 您需要一个支持CUDA(因为推理过程需要GPU)和flask的pytorch(版本> = 0.4)的python环境。 强烈建议使用Anaconda设置了环境,了解更多详情,请参考[]和[ ](适用于中国大陆用户的方便,请参见[])。 设置环境后,您可以通过键入以下内容轻松启动识别服务 python audio_server.py 进入您的命令行。 该命令将在端口22339上启动Web服务,因此您可以通过localhost:22339访问它 通过单击按钮,您的声音将被
2021-11-16 15:13:15 144.01MB JupyterNotebook
1
【语音识别】基于VQ特定人孤立词语音识别matlab 源码.md
2021-11-09 16:59:42 8KB 算法 源码
1
详细介绍了语音识别的现状,特别详细介绍了孤立词语音识别,并且着重介绍了DTW算法
2021-10-31 14:15:40 6.34MB DTW 孤立词语音识别,算法,实现
1
在这个项目中,我们要处理使用EM算法训练GMM-HMM的孤立单词数据。 测试阶段也考虑使用维特比算法。 结果表明,通过Matlab 编程获得的性能与HTK 的性能相似。 在运行这些程序之前,请先准备好训练和测试数据。 TIDIGITS 数据库的摘录可以从这个链接获得: http://www.ece.ucsb.edu/Faculty/Rabiner/ece259/speech recognition course.html 标题为“隔离的 TI 数字训练文件,8 kHz 采样,终结点:(isolated_digits_ti_train_endpt.zip)”。 或者您可以直接从这个链接下载训练数据库的 .zip 文件: - 训练数据: http://www.ece.ucsb.edu/Faculty/Rabiner/ece259/speech recognition cours
2021-10-19 23:13:52 32KB matlab
1
基于隐马尔可夫模型(HMM)的孤立字语音识别实验
2021-08-09 11:08:17 592KB 语音识别 孤立词 隐马尔科夫
1
基于动态时间规整(DTW)的孤立字语音识别实验
2021-08-09 11:08:16 1.42MB 语音识别 孤立词 基于动态时间调整
1
代码和说明文档
2021-07-18 12:01:21 682KB 语音信号处理 孤立词识别
1
HMM模型在语音孤立词识别中的应用,讲述模型的使用方法。
2021-05-26 11:26:01 1.27MB 语音识别 HMM
1
基于GMM-HMM的孤立词语音识别系统,内含训练和测试数据,是1-10的数字的音频,测试数据也是1-10,当然你可以自己改,只要改了标签即可。运行需要安装hmmlearn,scipy,numpy
2021-05-22 17:37:23 1.69MB 孤立词识别 GMM HMM python
1
HTK孤立词语音识别系统,实现的是6个单词的识别,所有文件打包,内有使用说明,运行命令可以直接识别。搭建的详细步骤参考我的博客: http://blog.csdn.net/cdj0311/article/details/17504165
2021-05-10 14:43:00 3.52MB HTK 语音识别 孤立词
1