基于隐马尔可夫模型(HMM)的孤立字语音识别系统,matlab实现,包含数据集以及源码
2022-05-29 16:05:23 601KB 语音识别 matlab 源码软件 人工智能
语音识别是机器通过识别和理解过程把人类的语音信号转变为相应文本或命令的技术,其根本目的是研究出一种具有听觉功能的机器。本设计研究孤立词语音识别系统及其在STM32嵌入式平台上的实现。识别流程是:预滤波、ADC、分帧、端点检测、预加重、加窗、特征提取、特征匹配。端点检测(VAD)采用短时幅度和短时过零率相结合。检测出有效语音后,根据人耳听觉感知特性,计算每帧语音的Mel频率倒谱系数(MFCC)。然后采用动态时间弯折(DTW)算法与特征模板相匹配,最终输出识别结果。先用Matlab对上述算法进行仿真,经多次试验得出算法中所需各系数的最优值。然后将算法移植到STM32嵌入式平台,移植过程中根据嵌入式平台存储空间相对较小、计算能力也相对较弱的实际情况,对算法进行优化。 系统硬件总体结构图 音频信号采集原理图 附件包含以下资料:
2022-05-28 10:57:50 2.17MB 嵌入式 语音识别 电路方案
1
Python基于深度学习的中文语音识别系统源码.zip
2022-05-25 15:09:01 5.82MB python 源码软件 深度学习 语音识别
为了提高语音识别系统的可靠性和高效率性,利用线性预测倒谱(LPCC)和动态时间规整技术(DTW)设计了一种语音识别系统。系统以TI公司的TMS320VC5402DSP芯片为控制核心,以汉语言的短命令为识别对象,实现特定孤立词语言识别功能。系统设计了串行通讯接口,更好地利用计算机对其控制。同时系统能进行语音指令的识别并做出相应的应答。该系统适合应用在一些智能控制领域,且结构简单,功能稳定。
2022-05-19 17:19:37 1.03MB 自然科学 论文
1
本文建立了一个孤立词语音识别系统, 并利用MATLAB 的语音工具箱voice box 对系统进行了仿真和分析。
2022-05-15 17:40:13 149KB 语音识别 matlab
1
基于深度学习的噪声抑制与语音识别系统.zip 计算机专业,软件工程专业,通信工程大学生课程设计 自己大三的时候写的 适合大家做课程设计,写毕业设计也可以参考 基于深度学习的课程设计
2022-05-14 16:05:50 17.82MB 深度学习 语音识别 人工智能
语音识别系统的硬件设计,可以参考下。
2022-05-14 09:59:43 1.48MB 语音识别
1
用TensorFlow实现的端到端自动语音识别系统 Automatic-Speech-Recognition 在 TensorFlow 中实现的端到端自动语音识别系统。 最近更新支持 TensorFlow r1.0 (2017-02-24) 支持动态 rnn 的 dropout (2017-03-11) 支持在 shell 文件中运行 (2017-03-11) 支持每几个训练周期自动评估 (2017-03- 11) 修复字符级自动语音识别的bug (2017-03-14) 改进一些可重用的函数apis (2017-03-14) 为数据预处理添加缩放(2017-03-15) 为LibriSpeech 训练添加可重用支持( 2017-03-15) 添加简单的 n-gram 模型用于随机生成或统计使用 (2017-03-23) 改进一些用于预处理和训练的代码 (2017-03-23) 用空格替换 TAB 并添加 nist2wav 转换器脚本(2017-04-20) 增加一些数据准备代码 (2017-05-01) 增加WSJ 语料库标准预处理s5 recipe (2017-05-05) 项目
2022-05-06 15:00:21 189KB 机器学习
1
语音识别技术越来越多地用于电话应用,例如旅行预订和信息,金融帐户信息,客户服务呼叫路由和目录服务。 使用受约束的语法识别,此类应用程序可以实现非常高的准确性。 随着实现这种语音激活系统的成本下降并且这些系统的实用性和有效性得到了提高,语音识别技术的研究和开发持续增长。 例如,为电话应用程序优化的识别系统通常可以提供有关特定识别的置信度的信息,如果置信度低,则可以触发该应用程序以提示呼叫者确认或重复他们的请求。 索引词:语音,识别,验证,声音,孤立,单词。
2022-05-04 23:23:10 1.69MB 开源软件
1
基于深度学习的噪声抑制与语音识别系统功能如下 1、噪声抑制: (1)提供对音频进行转换成频谱图,让用户分析起来更加直观。 (2)可以进行录音,并将录进的音频内容保存到指定的文件夹中。 (3)同时可以对录进的音频进行添加噪音,添加研究内容。 (4)可以对录制的音频进行降噪处理,使录进的音频听起来更加清晰。 (5)可以将处理后的音频播放出来。 2、语音合成: (1)提供对用户想输入的两段文字的编辑功能。 (2)可以将用户输入的两段文字合成为一段文字并将文字转换为音频信息。 (3)可以存取转换后的音频,也可以存取任意一段文字所转换的音频。 (4)可以将存取的音频播放出来 3、语音识别: (1)提供对于用户输入的音频进行录制。 (2)可以将用户录入的音频存储到指定路径中并进行播放。 (3)将存储的音频识别成文字的方式进行输出。 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音
2022-05-04 12:06:25 17.82MB 源码软件 深度学习 语音识别 人工智能