base64码的语音文件,转码后成为文件后在页面中arm正常播放的js插件的使用
2022-07-04 10:35:06 1.39MB arm语音播放
1
Android平台使用PocketSphinx做离线语音识别,小范围语音99%识别率.zip
2022-07-04 09:10:52 651KB Android
基于python的中文语音识别系统. 包含声学模型和语言模型两个部分组成,两个模型都是基于神经网络。 声学模型 - acoustic_model文件夹下 该项目实现了GRU-CTC中文语音识别声音模型,所有代码都在gru_ctc_am.py中,包括: 增加了基于科大讯飞DFCNN的CNN-CTC结构的中文语音识别模型cnn_ctc_am.py,与GRU相比,对网络结构进行了稍加改造。 完全使用DFCNN框架搭建声学模型,稍加改动,将部分卷积层改为inception,使用时频图作为输入,cnn_with_fbank.py。 新增使用pluse版数据集的模型,cnn_with_full.py,建议直接训练这个模型。 语言模型 - language_model文件夹下 新增基于CBHG结构的语言模型language_model\CBHG_lm.py,该模型之前用于谷歌声音合成,移植到该项目中作为基于神经网络的语言模型。 数据集 增加stc、primewords、Aishell、thchs30四个数据集,整理为相同格式,放于acoustic_model\data中,调用四个数据集的脚本
2022-07-03 21:08:28 34.52MB 人工智能 语音识别 python 深度学习
PM60 系列智能语音集成电路.doc
2022-07-03 21:05:02 119KB 技术资料
用于 open_stt 数据集的 PyTorch E2E ASR 用于训练语音识别任务的语言和声学模型的最少脚本集。 训练管道包括以下阶段: 基于字符的RNN语言模型 具有 CTC 损失的 CNN-RNN 声学模型 基于字符的 RNN 语言模型和具有 RNN-T 损失的 CNN-RNN 声学模型 使用强化学习和 RNN-T 损失进行微调 结果 下表显示了。 阶段 模型 失利 更新 核证减排量 世界范围内 1 LM 行政长官 2407000 2 是 反恐委员会 216850 19.9 57.0 3 LM+AM 循环神经网络 108425 21.7 45.6 4 LM+AM 强化学习 300 19.2 43.9 要求 PyTorch >= 1.3(带有错误修复 ) 预处理 基于 log mel 滤波器组的声学模型,带有 40 个大小为 25 毫秒的滤波器,
1
多功能语音控制小车.doc
2022-07-03 11:04:14 220KB 技术资料
单片机控制语音芯片的录放音系统的设计资料.doc
2022-07-03 11:03:56 8.07MB 技术资料
ISD2500系列单片语音录放电路资料.doc
2022-07-03 11:03:42 791KB 技术资料
ISD2500系列单片语音录放电路.doc
2022-07-03 11:03:41 755KB 技术资料
国际电信联盟的无源音质客观评价标准P.563算法源代码,以及技术说明文档,代码直接能编译使用,测试确实对音质有比较明显的评分差异,直接输出MOS分
1