矢量量化(VQ)技术 概述 基本原理 失真测度 矢量量化器的最佳码本设计 矢量量化技术的优化设计 动态时间规整(DTW)技术 一般来说,语音识别的方法有三种:基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。 语音学和声学的方法 该方法起步较早,在语音识别技术提出的开始,就有了这方面的研究,但由于其模型及语音知识过于复杂,现阶段没有达到实用的阶段。 神经网络的方法 基于ANN的语音识别系统通常由神经元、训练算法及网络结构等三大要素构成。由于基于神经网络的训练识别算法由于实现起来较复杂,目前仍只是处于实验室研究阶段。 模板匹配 作用是按照一定的准则求取待测语音特征参数和语音信息与模式库中相应模板之间的失真测度,最匹配的就是识别结果。 模板匹配的方法发展比较成熟,目前己达到了实用阶段。 常用的技术有三种: 矢量量化(VQ)技术 动态时间规整(DTW)
2022-04-06 14:08:13 1.21MB 矢量量化 VQ VectorQuantizat 语音识别
1
由于HMM是在马尔可夫链的基础上发展而来的,为了更好的理解HMM,我们先了解一下马尔可夫链的基本概念。 HMM的基本理论 HMM模型在实际应用时需要解决的三个问题 HMM在语音处理中的应用 隐含马尔科夫模型HMM(Hidden Markov Model)是一种识别算法,HMM的精髓在于:观察可测,状态隐含。 HMM是一个双内嵌式随机过程,即HMM是由两个随机过程组成,其中之一是Markov链,这是基本随机过程,它描述状态的转移,另一个随机过程描述状态和观察值之间的统计对应关系。 我们考察语音,也可以发现类似的情况。语音中当前的发音音素与下一个发音音素之间以某种概率发生转移。我们听到(观察到)的只能是发音后产生的语音波形信息,假如仅考虑语音的波形(而不是经过人的听觉分析),则很难知道该语音波形对应的音素信息是什么。
1
本文主要介绍如何使用python搭建一个:基于TensorFlow的语音识别系统。 本文主要分为3部分: - 1、项目数据集介绍。 - 2、项目功能及相关代码展示。 - 3、项目完整下载地址。 博主也参考过语音识别系统相关模型的文章,但大多是理论大于方法。很多同学肯定对原理不需要过多了解,只需要搭建出一个可视化系统即可。 也正是因为我发现网上大多的帖子只是针对原理进行介绍,功能实现的相对很少。 如果您有以上想法,那就找对地方了! 不多废话,直接进入正题!
2022-04-06 03:12:26 666.68MB 语音识别 python tensorflow 卷积神经网络
Unity中接入科大讯飞SDK的示例,包含语音识别与语音合成功能
2022-04-06 03:05:32 3.85MB Unity iFlytek 科大讯飞 语音识别
1
臭豆腐叫卖语音,可直接下载
2022-04-06 02:59:39 28.93MB 语音识别
1
语音信号处理-语音编码 语音信号压缩编码的原理 波形编码算法 参数编码算法 混合编码算法 现代通信中的语音信号编码方法(EVRC算法) 语音信号的数字化传输一直是通信发展的主要方向之一,语音的数字传输与模拟传输相比具有更好的效率和性能,使得语音的传输变得多样化、追求低成本变得可能、保密的要求也得到了满足。但是,如果对语音信号直接采用模/数变换技术进行编码,则传输或存储语音的数据量太大,因此为了降低传输或存储的费用,就必须对其进行压缩。
2022-04-06 02:54:17 794KB 语音编码 语音信号处理 语音识别
1
语音信号处理-语音增强 线性预测技术是语音处理中最有效的手段,但是最容易受噪声影响。 原因:若将线性预测技术看做频谱匹配过程,则在含大量噪声的语音会使频谱畸变,但是预测器就设法与畸变频谱匹配,而不是与目标语音频谱匹配。当在声码器的接收端使用与发送端相同的预测器时,则复原语音的可懂度大大降低。 语音增强是从带噪声信号中提取尽可能纯净的原始语音,是解决噪声污染的一种有效方法。 主要应用范围:降低听觉噪声识别系统的与处理和线性预测编码的与处理。这种技术对语音识别和说话人识别是十分重要,可识别装置可以在含噪环境下进行工作。 目前语音增强已发展成为语音信号数字处理的一个重要分支。
1
说话人识别 (Speaker Recognition,SR) 和情感识别 (Speech Emotion Recognition) 1 说话人识别 1.1说话人识别概述 1.2 说话人识别基本原理 1.3应用领域及技术难点 2 语音情感识别 2.1情感的分类 2.2语音情感特征分析 2.3语音情感识别方法 2.4存在的问题
1
LD3320A语音识别模块(带串口版本)源码
2022-04-06 01:26:54 152.49MB 语音识别 人工智能 LD3320A 串口通信
1
语音识别中双门限端点检测算法的研究,肖宜,,语音信号起止点的判别是任何一个语音识别系统必不可少的组成部分。有噪声的情况下,单纯用短时能量或者短时过零率不能准确检测出
2022-04-05 22:52:52 196KB 语音识别
1