%求增益补偿阈值,凡是小于该阈值的增益系数军用阈值来代替,这样可减少音乐噪声 spec_floor=b*noise_PSD./per_PSD(:,k); spec_floor=spec_floor(:,ones(1,frame_num)); [I,J]=find(g
2022-04-17 09:07:14 16.09MB 语音识别 人工智能 HMM
PyTorch-Kaldi语音识别工具包PyTorch-Kaldi是一个开放源代码存储库,用于开发最新的DNN / HMM语音识别系统。 DNN部分由PyTorch管理,而特征提取,标签合成则由PyTorch-Kaldi语音识别工具包PyTorch-Kaldi是一个开放源代码存储库,用于开发最新的DNN / HMM语音识别系统。 DNN部分由PyTorch管理,而特征提取,标签计算和解码则由Kaldi工具包执行。 该存储库包含PyTorch-Kaldi工具箱的最新版本(PyTorch-Kaldi-v1.0)。 要查看以前的版本(PyTorch-Kaldi-v0.1),请单击此处。 如果您使用此代码或部分代码,请
2022-04-13 17:21:24 362KB Python Deep Learning
1
python中文深度学习语音识别系统
2022-04-08 17:06:40 26.09MB python 深度学习 语音识别 开发语言
本文主要介绍如何使用python搭建一个:基于TensorFlow的语音识别系统。 本文主要分为3部分: - 1、项目数据集介绍。 - 2、项目功能及相关代码展示。 - 3、项目完整下载地址。 博主也参考过语音识别系统相关模型的文章,但大多是理论大于方法。很多同学肯定对原理不需要过多了解,只需要搭建出一个可视化系统即可。 也正是因为我发现网上大多的帖子只是针对原理进行介绍,功能实现的相对很少。 如果您有以上想法,那就找对地方了! 不多废话,直接进入正题!
2022-04-06 03:12:26 666.68MB 语音识别 python tensorflow 卷积神经网络
设计了一个基于Matlab软件的语音识别系统,其主要功能有语音信号的录制、播放、预处理、分段滤波、特征提取以及识别语音。通过实验验证了本系统能够达到识别简单语音的要求。
2022-03-26 06:24:26 193KB 语音识别
1
基于HMM的视听语音识别系统,史秋萍,,语音识别技术是一门涉及面很广的交叉学科,具有很大的研究价值。本文提出了一种基于隐马尔可夫模型(HMM)的视听融合的语音识别系
2022-03-08 20:57:16 181KB HMM
1
语音识别使机器可以通过识别和理解过程将语音信号转换为文本。 提取特征,预测最大可能性并生成输入语音信号的模型被认为是配置自动语音识别系统(ASR)的最重要步骤。 本文利用MATLAB建立了一个自动阿拉伯语语音识别系统,并从19位阿拉伯语母语使用者中记录了24个阿拉伯语单词Consonant-Vowel Consonant-Vowel Consonant-Vowel(CVCVCV),每个说话者说出同一单词3次(共1368个单词) )。 为了测试该系统,通过将语音信号划分为约0.25秒的帧和0.10秒的偏移,提取了39个特征。 在后端,通过将特征分成4到10之间的状态数来生成统计模型,每个状态具有8高斯分布。 数据具有48 k采样率和32位深度,并以wave文件格式单独保存。 该系统接受了语音丰富而均衡的阿拉伯语语音列表训练(10个发言人* 3次* 24个单词,总共720个单词),并使用另一个单词列表(24个词语* 9个发言人* 3次*,总共648个单词)进行了测试。 使用不同说话者的相似单词,系统获得了非常好的单词识别准确度结果,为92.92%,单词错误率(WER)为7.08%。
2022-03-08 20:54:24 549KB 行业研究
1
OpenASR的 基于pytorch的end2end语音识别系统。 主要体系结构是 。 特征 最小依赖。 该系统不依赖外部软件进行特征提取或解码。 用户只需安装PyTorch深度学习框架。 良好的表现。 该系统包括高级算法,例如标签平滑,SpecAug,LST,并在ASHELL1上实现了良好的性能。 AISHELL1测试的基准CER为6.6,优于ESPNet。 模块化设计。 我们将系统分为几个模块,例如培训师,指标,进度表,模型。 扩展和添加功能很容易。 End2End 。 特征提取和标记化是在线的。 系统直接处理波形文件。 因此,该过程大大简化了。 相依性 python> = 3.6 火炬> = 1.1 pyyaml> = 5.1 tensorflow和tensorboardX进行可视化。 (如果不需要可视化结果,可以在src / utils.py中将TENSORBOARD_
2022-03-08 11:24:36 2.24MB speech transformer speech-recognition las
1
是一篇关于基于单片机的语音识别的论文,理论性很强。有较强的学习价值。
2022-03-07 20:34:24 2.72MB 单片机 语音识别
1
欢迎下载研华科技主题白皮书: 《2019研华嵌入式服务指南》 [摘要] 作为嵌入式市场的领导厂商,研华IoT嵌入式平台事业群提供一站式服务,整合嵌入式主板与系统、软件、显示屏及外围设备,以客户为中心的设计服务,广泛应用于不同行业。为迎接物联网(IoT)和云端运算时代的到来,除深化既有产品的应用,也提供软硬件整合物联网解决方案,发展以IoT为中心的智能应用,帮助客户快速落地物联网应用。研华嵌入式物联网解决方案包括M2.COM感知平台、网关、EIS边缘智能服务器和WISE-PaaS嵌入式物联网软件平台。 https://www.eefocus.com/resource/advantech/index.p... 语音识别是机器通过识别和理解过程把人类的语音信号转变为相应文本或命令的技术,其根本目的是研究出一种具有听觉功能的机器。本设计研究孤立词语音识别系统及其在STM32嵌入式平台上的实现。识别流程是:预滤波、ADC、分帧、端点检测、预加重、加窗、特征提取、特征匹配。端点检测(VAD)采用短时幅度和短时过零率相结合。检测出有效语音后,根据人耳听觉感知特性,计算每帧语音的Mel频率倒谱系数(MFCC)。然后采用动态时间弯折(DTW)算法与特征模板相匹配,最终输出识别结果。先用Matlab对上述算法进行仿真,经多次试验得出算法中所需各系数的最优值。然后将算法移植到STM32嵌入式平台,移植过程中根据嵌入式平台存储空间相对较小、计算能力也相对较弱的实际情况,对算法进行优化。最终设计并制作出基于STM32的孤立词语音识别系统。 系统硬件总体结构图 附件内容如下:
2022-03-07 10:08:43 2.15MB 语音识别 电路方案
1