电脑面前的你,是否也希望能让电脑听命于你?   当你累的时候,只需说一声“我累了”,电脑就会放着优雅的轻音乐来让你放松。 或许你希望你在百忙之中,能让电脑郎读最新的NBA比分赛况….一切都是那么惬意。 在此告诉你,不要灰心,我们真的可以做一个。做一个语音识别? 我相信很多人到这里会有两个心态,一是好奇,二是避之千里。 其实不然,你可以不用懂太多的编程技能,你甚至也可以不用懂自然语言处理技术,这篇文章虽然实现了语音操控但是绝没有你们想象的那么复杂。 如果仅仅把语音识别作为一个实现了的接口的话,剩下的逻辑就仅仅是IF-ELSE这些简单的元素了。 实现语音操控的原理 语音操控分为 语音识别和语音朗读
2022-07-04 16:13:34 76KB python python实例 电脑
1
base64码的语音文件,转码后成为文件后在页面中arm正常播放的js插件的使用
2022-07-04 10:35:06 1.39MB arm语音播放
1
Android平台使用PocketSphinx做离线语音识别,小范围语音99%识别率.zip
2022-07-04 09:10:52 651KB Android
基于python的中文语音识别系统. 包含声学模型和语言模型两个部分组成,两个模型都是基于神经网络。 声学模型 - acoustic_model文件夹下 该项目实现了GRU-CTC中文语音识别声音模型,所有代码都在gru_ctc_am.py中,包括: 增加了基于科大讯飞DFCNN的CNN-CTC结构的中文语音识别模型cnn_ctc_am.py,与GRU相比,对网络结构进行了稍加改造。 完全使用DFCNN框架搭建声学模型,稍加改动,将部分卷积层改为inception,使用时频图作为输入,cnn_with_fbank.py。 新增使用pluse版数据集的模型,cnn_with_full.py,建议直接训练这个模型。 语言模型 - language_model文件夹下 新增基于CBHG结构的语言模型language_model\CBHG_lm.py,该模型之前用于谷歌声音合成,移植到该项目中作为基于神经网络的语言模型。 数据集 增加stc、primewords、Aishell、thchs30四个数据集,整理为相同格式,放于acoustic_model\data中,调用四个数据集的脚本
2022-07-03 21:08:28 34.52MB 人工智能 语音识别 python 深度学习
PM60 系列智能语音集成电路.doc
2022-07-03 21:05:02 119KB 技术资料
用于 open_stt 数据集的 PyTorch E2E ASR 用于训练语音识别任务的语言和声学模型的最少脚本集。 训练管道包括以下阶段: 基于字符的RNN语言模型 具有 CTC 损失的 CNN-RNN 声学模型 基于字符的 RNN 语言模型和具有 RNN-T 损失的 CNN-RNN 声学模型 使用强化学习和 RNN-T 损失进行微调 结果 下表显示了。 阶段 模型 失利 更新 核证减排量 世界范围内 1 LM 行政长官 2407000 2 是 反恐委员会 216850 19.9 57.0 3 LM+AM 循环神经网络 108425 21.7 45.6 4 LM+AM 强化学习 300 19.2 43.9 要求 PyTorch >= 1.3(带有错误修复 ) 预处理 基于 log mel 滤波器组的声学模型,带有 40 个大小为 25 毫秒的滤波器,
1
多功能语音控制小车.doc
2022-07-03 11:04:14 220KB 技术资料
单片机控制语音芯片的录放音系统的设计资料.doc
2022-07-03 11:03:56 8.07MB 技术资料
ISD2500系列单片语音录放电路资料.doc
2022-07-03 11:03:42 791KB 技术资料
ISD2500系列单片语音录放电路.doc
2022-07-03 11:03:41 755KB 技术资料