DFT的matlab源代码MFCC自动语音识别算法的实现 用于自动语音识别(ASR)的梅尔频率倒谱系数(MFCC)和动态时间规整(DTW)算法的Python 2.7实现。 方法 从.wav文件读取音频数据和采样频率 帧信号 将窗口功能应用于框架(默认值=汉明) 计算帧的DFT 计算每个DFT仓的周期图功率谱密度估计 应用梅尔频率滤波器组进行信号 对每个滤波器内的能量求和,并以10为底的对数 取每个滤波器的DCT 保持系数[1:13] 计算参考向量和输入向量的DTW最佳路径和欧式距离 去做 噪音门 预加重/提升 特征向量数据库 音频记录/播放( audio.py ) 多线程MFCC提取 创建MFCC提取程序作为类?
2022-05-12 08:40:21 7.83MB 系统开源
1
matlab说话代码语音识别系统 这是关于使用MATLAB实现信号分析和语音识别系统。 特征 Speech_recognition_1.m 音频信号图 语音起点和终点检测 离散傅立叶变换 信号预加重 信号压缩(线性预测编码) Speech_recognition_2.m 特征提取(MFCC) 使用失真矩阵和动态规划的语音识别 数据 该项目中使用的数据是通过人工记录的。 “ 1、2、4、5、6”的声音分别录制了两次,分为2组。 重复录音主要用于语音识别部分,一组已知,用于测试以对语音进行分类。 结果 输出保存在./result目录中。 包括:信号波,DFT波,梅尔倒谱,点检测结果,识别结果。
2022-05-12 08:32:05 1.43MB 系统开源
1
matlab语音使用代码代码语音识别 语音识别项目 - 使用频谱分析和傅立叶变换将语音与保存的 .wav 文件正确匹配。 在这个项目中,我利用 MATLAB 和我对图像傅里叶变换的理解……将其转换为波形数据以分析波谱模式,将语音笔记与保存的扬声器文件进行比较。 注 - 要运行代码,请将所有文件下载到同一文件夹中并运行 PRACTICE.m。 现在你需要几个扬声器的音频文件,并重复 5 次他们说一个词。 此处使用的示例是“零”。 例如,现在将它们保存为“1s1”格式。 其中第一个数字声明说话者,最后一个数字声明重复编号。 报告将很快附上 - 等待大学访问。
2022-05-11 17:29:16 6KB 系统开源
1
我们记录一个人的声音进行语音识别,将其转换为数字形式进行分析。
2022-05-10 17:25:01 1KB matlab
1
【语音识别】基于DTW算法实现09数字和汉字语音识别含Matlab源码
2022-05-10 17:01:57 277KB
1
0 到 9 数字识别
2022-05-10 15:35:30 2KB matlab
1
开发需要准备相关的 IDE 和 JDK8 开发环境 , 前端开发需要下载vscode hbuilderx 后端Eclips`或IDEA #### 项目介绍 项目分成前台和后台,前台就是小程序端,后台就是后台管理系统。项目稍微粗糙了点,因为主要以学习并整合技术栈为目的做的项目, 账号:数据库里有 密码:一般为手机号后六位 ###后台管理系统 登录页 首页 轮播图管理 图像识别管理 语音识别管理 角色管理 个人信息 前端:后台管理系统采用 vue-element-admin后台集成方案进行二次开发。微信小程序采用 uni-app开发框架。 后端:后台管理模块采用 SpringBoot + Dubbo 构建后端分布式服务,使用 Shiro 做系统安全框架,配合 RBAC 设计模式实现用户的权限管理,使用 Redis 对用户token及字典数据进行缓存;小程序模
2022-05-10 12:03:38 100.94MB java javascript
我最近遇到了下面的文章。 http://www.mathworks.com.au/company/newsletters/articles/developing-an-isolated-word-recognition-system-in-matlab.html 你需要一个来自http://www.ee.columbia.edu/~dpwe/resources/matlab/rastamat/的工具箱来运行我的文件。 从 Bowon Lee 获取 VAD 程序 非常欢迎您修改代码并重新分发。
2022-05-10 09:31:37 675KB matlab
1
通过系统自带的语音系统,实现语音录入文本,配合文本播放,可以与机器进行对话,通过系统还可以控制机器关机和其他的操作!
2022-05-10 00:33:47 230KB delphi 语音识别
1
windows下安装编译HTK语音识别工具包
2022-05-09 18:22:21 400KB HTK
1