基于HMM的视听语音识别系统,史秋萍,,语音识别技术是一门涉及面很广的交叉学科,具有很大的研究价值。本文提出了一种基于隐马尔可夫模型(HMM)的视听融合的语音识别系
2022-03-08 20:57:16 181KB HMM
1
语音识别使机器可以通过识别和理解过程将语音信号转换为文本。 提取特征,预测最大可能性并生成输入语音信号的模型被认为是配置自动语音识别系统(ASR)的最重要步骤。 本文利用MATLAB建立了一个自动阿拉伯语语音识别系统,并从19位阿拉伯语母语使用者中记录了24个阿拉伯语单词Consonant-Vowel Consonant-Vowel Consonant-Vowel(CVCVCV),每个说话者说出同一单词3次(共1368个单词) )。 为了测试该系统,通过将语音信号划分为约0.25秒的帧和0.10秒的偏移,提取了39个特征。 在后端,通过将特征分成4到10之间的状态数来生成统计模型,每个状态具有8高斯分布。 数据具有48 k采样率和32位深度,并以wave文件格式单独保存。 该系统接受了语音丰富而均衡的阿拉伯语语音列表训练(10个发言人* 3次* 24个单词,总共720个单词),并使用另一个单词列表(24个词语* 9个发言人* 3次*,总共648个单词)进行了测试。 使用不同说话者的相似单词,系统获得了非常好的单词识别准确度结果,为92.92%,单词错误率(WER)为7.08%。
2022-03-08 20:54:24 549KB 行业研究
1
OpenASR的 基于pytorch的end2end语音识别系统。 主要体系结构是 。 特征 最小依赖。 该系统不依赖外部软件进行特征提取或解码。 用户只需安装PyTorch深度学习框架。 良好的表现。 该系统包括高级算法,例如标签平滑,SpecAug,LST,并在ASHELL1上实现了良好的性能。 AISHELL1测试的基准CER为6.6,优于ESPNet。 模块化设计。 我们将系统分为几个模块,例如培训师,指标,进度表,模型。 扩展和添加功能很容易。 End2End 。 特征提取和标记化是在线的。 系统直接处理波形文件。 因此,该过程大大简化了。 相依性 python> = 3.6 火炬> = 1.1 pyyaml> = 5.1 tensorflow和tensorboardX进行可视化。 (如果不需要可视化结果,可以在src / utils.py中将TENSORBOARD_
2022-03-08 11:24:36 2.24MB speech transformer speech-recognition las
1
天津大学的论文,拿出来和大家分享,文章中含有matlab代码
2022-03-08 02:08:26 237KB 语音识别
1
是一篇关于基于单片机的语音识别的论文,理论性很强。有较强的学习价值。
2022-03-07 20:34:24 2.72MB 单片机 语音识别
1
盲信号用于语音识别maltab程序代码 FIXED-POINT FREQUENCY DOMAIN ICA with GENERALIZED GAUSSIAN FUNCTION BASED NEGENTROPY APPROXIMATION for SPEECH SIGNAL SEPARATION
2022-03-07 18:27:16 844KB matlab
1
欢迎下载研华科技主题白皮书: 《2019研华嵌入式服务指南》 [摘要] 作为嵌入式市场的领导厂商,研华IoT嵌入式平台事业群提供一站式服务,整合嵌入式主板与系统、软件、显示屏及外围设备,以客户为中心的设计服务,广泛应用于不同行业。为迎接物联网(IoT)和云端运算时代的到来,除深化既有产品的应用,也提供软硬件整合物联网解决方案,发展以IoT为中心的智能应用,帮助客户快速落地物联网应用。研华嵌入式物联网解决方案包括M2.COM感知平台、网关、EIS边缘智能服务器和WISE-PaaS嵌入式物联网软件平台。 https://www.eefocus.com/resource/advantech/index.p... 语音识别是机器通过识别和理解过程把人类的语音信号转变为相应文本或命令的技术,其根本目的是研究出一种具有听觉功能的机器。本设计研究孤立词语音识别系统及其在STM32嵌入式平台上的实现。识别流程是:预滤波、ADC、分帧、端点检测、预加重、加窗、特征提取、特征匹配。端点检测(VAD)采用短时幅度和短时过零率相结合。检测出有效语音后,根据人耳听觉感知特性,计算每帧语音的Mel频率倒谱系数(MFCC)。然后采用动态时间弯折(DTW)算法与特征模板相匹配,最终输出识别结果。先用Matlab对上述算法进行仿真,经多次试验得出算法中所需各系数的最优值。然后将算法移植到STM32嵌入式平台,移植过程中根据嵌入式平台存储空间相对较小、计算能力也相对较弱的实际情况,对算法进行优化。最终设计并制作出基于STM32的孤立词语音识别系统。 系统硬件总体结构图 附件内容如下:
2022-03-07 10:08:43 2.15MB 语音识别 电路方案
1
目前,语音识别,即将语音内容转换为文字的技术已经比较成熟,遥想当时锤子发布会上展示的讯飞输入法语音识别,着实让讯飞火了一把。由于此类语音识别需要采集大量的样本,才能达到一定的准确度,个人很难从零开始搭建。但是,许多拥有语音识别技术的公司,或多或少会提供一些API或者SDK供开发者使用,这样就把语音识别的门槛降到了一个很低的程度,只需几行代码即可实现。下面我介绍以下如何使用Python调用百度的REST API实现一个简单的语音识别。 注册账号,并成为开发者 打开 http://yuyin.baidu.com/ ,并且使用你的百度账号登陆,如果你不是开发者,系统会自动引导你申请成为开发者。 创
2022-03-06 20:24:47 59KB api python rest
1
Unity 百度 语音识别-语音合成
2022-03-04 14:25:15 60KB 语音识别 语音合成 Unity
1
基于语音识别及RFID的多重安防门禁监控系统
2022-03-04 09:45:02 2.45MB 语音识别 RFID 多重安防
1