经过几十年的研究与发展,语音识别建立了以隐马尔可夫模型(Hidden Markov Models,HMM)为基础的框架。近几年,在HMM基础上深度神经网络(Deep Neural Network,DNN)的应用大幅度提升了语音识别系统的性能。DNN将每一帧语音及其前后的几帧语音拼接在一起作为网络的输入,从而利用语音序列中上下文的信息。DNN中每次输入的帧数是固定的,不同的窗长对最终的识别结果会有影响。递归神经网络(Recurrent neural network,RNN)通过递归来挖掘序列中的上下文相关信息,在一定程度上克服了DNN的缺点。但是RNN在训练中很容易出现梯度消失的问题,无法记忆长时信息。长短期记忆单元(Long Short-Term Memory,LSTM)通过特定的门控单元使得当前时刻的误差能够保存下来并选择性传给特定的单元,从而避免了梯度消失的问题。本文对RNN及LSTM的基本原理进行了介绍,并且在TIMIT语音数据库上进行了实验。实验结果表明,LSTM型递归神经网络在语音识别上的可以取得较好的识别效果
2023-01-22 13:59:06 280KB LSTM
1
matlab精度检验代码ECE 5775最终项目 基于神经网络的Xilinx Zedboard上具有固定延迟的语音命令识别方法 ,和的项目。 每个文件夹及其内容的说明如下 audio_lab 它包含Xilinx Vivado和SDK项目,以将位流编程到FPGA并配置如何将数据发送到FPGA。 合并的 这包含我们基于Xilinx Vivado HLS对FPGA综合进行的集成测试,该测试基于3种不同的数据类型。 这些基于float数据类型,双精度float数据类型和Xilinx ap_fixed数据类型。 ap_fixed数据类型具有最快的运行时间,但就位宽而言并不是非常优化。 组件 Matlab的 该文件夹包含用于在MATLAB中生成训练和测试数据的所有必需文件。 在文件中查找更多详细信息 神经网络 该文件夹包含三层神经网络实现。 它学习使用前馈网络,然后进行反向传播。 分类输入以随机顺序输入网络。 在每个输入通过网络馈送之后,将检查每个输出神经元的值,并将其与所需的输出进行比较,以获取误差。 该误差通过层之间的所有边缘传播回去,并且权重在“学习”过程中进行调整。 重复该过程,直到达到期
2023-01-11 19:30:18 67.01MB 系统开源
1
进行语音识别的时候会用到timit语音资料库进行训练,但是该资料又很难寻找,于是我将其上传至csdn,希望可以帮助到更多的人。由于csdn上传文件大小限制,我将全部文件拆成三部分,这个是第3部分,其内包含TRAIN文件夹的后半部分,也就是后四个英语方言地区的语音数据。
2023-01-06 17:22:50 136.13MB 人工智能 timit语音资料库 语音识别 kaldi
1
XiaoAiLite_qr_v2.8.70.apk
2023-01-02 11:18:53 35.35MB AI Android apk 语音识别
1
语音识别作为信息技术中一种人机接口的关键技术,具有重要的研究意义和广泛的应用价值。介绍了语音识别技术发展的历程,具体阐述了语音识别概念、基本原理、声学建模方法等基本知识,并对语音识别技术在各领域的应用作了简要介绍。
1
华为电话程控交换机U1910 U1930 系列 LMT 连接工具 window系统连接工具 华为语音设备连接 华为技术
2022-12-27 19:16:56 126.82MB 华为 语音识别 程控 交换机
1
载一段音频信号,或录制一段各人自己的语音信号作为分析的对象,利用 Matlab 中的随机函数产生噪声加入到语音信号中,模仿语音信号被污染,并对原信号和含噪声的信号进行频谱分析。比较不同类型滤波器的性能,选择一种合适的数字滤波器的设计方法,对被噪声污染的信号进行滤波,分析滤波后信号的时域和频域特征,回放音频信号,分别绘制原信号、含噪声信号和滤波后信号的时域波形图和频谱图以及滤波器的频响特性曲线。
2022-12-22 12:35:40 839KB matlab 语音识别 开发语言
1
智能语音识别芯片LD3320资料(技术开发手册)。 1、包括PDF格式文档:LD3320数据手册。 2、包括PDF格式文档:LD3320开发手册。 3、包括PDF格式文档:LD3320并行串行读写辅助说明。 4、以上文档中含智能语音识别芯片LD3320的开发参考程序代码和参考电路图。 5、LD3320是一款语音识别芯片,一般用于人工智能的自动语音识别场合。
2022-12-21 16:28:34 1.57MB LD3320 人工智能 语音识别 技术开发手册
1
语音朗读-语音识别安卓Android源代码
2022-12-19 16:20:21 5.19MB Android源代码 语音朗读 语音识别
这里包括完整的语音识别功能,包括语音转化为文本信息,语音控制计算机的操作命令,还有文字转换为语音信息,秩序讲代码在进行编译执行就可以,各个配置已经完成!
2022-12-13 18:06:46 13.46MB 语音识别 语音文字互转
1