android语音视频通话源码.rar
2022-07-04 22:03:48 10.26MB android
将 Windows10/Windows8 中自带的语音库 Microsoft Desktop Huihui 安装到 XP 的方法。 Win8语音库MS-Huihui转XP,这个是语音库,安装后无界面,可用微软提供的免费的TTSApp 这个工具选安装的语音库播音。Windows10/Windows8 里面自带了一个优质tts语音库叫 Microsoft Desktop Huihui 发音很好,但是xp自带的 Sam 发音很一般,如何才能将 Microsoft Desktop Huihui 移植到 XP? 微软本身并没提供方法,但是方法是有的。现在我已经将此方法打包成一个安装包,方便有需要的人下载安装。 安装后的语音库在WIN7下的名字叫“Microsoft Server Speech Text to Speech Voice (zh-CN, HuiHui)”。
2022-07-04 21:48:13 98.26MB 系统工具
1
BP神经网络的数据分类——语音特征信号分类.7zBP神经网络的数据分类——语音特征信号分类.7z
matlab语音信号处理函数 PCM编码
2022-07-04 16:40:37 125KB matlab 语音信号 PCM
1
电脑面前的你,是否也希望能让电脑听命于你?   当你累的时候,只需说一声“我累了”,电脑就会放着优雅的轻音乐来让你放松。 或许你希望你在百忙之中,能让电脑郎读最新的NBA比分赛况….一切都是那么惬意。 在此告诉你,不要灰心,我们真的可以做一个。做一个语音识别? 我相信很多人到这里会有两个心态,一是好奇,二是避之千里。 其实不然,你可以不用懂太多的编程技能,你甚至也可以不用懂自然语言处理技术,这篇文章虽然实现了语音操控但是绝没有你们想象的那么复杂。 如果仅仅把语音识别作为一个实现了的接口的话,剩下的逻辑就仅仅是IF-ELSE这些简单的元素了。 实现语音操控的原理 语音操控分为 语音识别和语音朗读
2022-07-04 16:13:34 76KB python python实例 电脑
1
base64码的语音文件,转码后成为文件后在页面中arm正常播放的js插件的使用
2022-07-04 10:35:06 1.39MB arm语音播放
1
Android平台使用PocketSphinx做离线语音识别,小范围语音99%识别率.zip
2022-07-04 09:10:52 651KB Android
基于python的中文语音识别系统. 包含声学模型和语言模型两个部分组成,两个模型都是基于神经网络。 声学模型 - acoustic_model文件夹下 该项目实现了GRU-CTC中文语音识别声音模型,所有代码都在gru_ctc_am.py中,包括: 增加了基于科大讯飞DFCNN的CNN-CTC结构的中文语音识别模型cnn_ctc_am.py,与GRU相比,对网络结构进行了稍加改造。 完全使用DFCNN框架搭建声学模型,稍加改动,将部分卷积层改为inception,使用时频图作为输入,cnn_with_fbank.py。 新增使用pluse版数据集的模型,cnn_with_full.py,建议直接训练这个模型。 语言模型 - language_model文件夹下 新增基于CBHG结构的语言模型language_model\CBHG_lm.py,该模型之前用于谷歌声音合成,移植到该项目中作为基于神经网络的语言模型。 数据集 增加stc、primewords、Aishell、thchs30四个数据集,整理为相同格式,放于acoustic_model\data中,调用四个数据集的脚本
2022-07-03 21:08:28 34.52MB 人工智能 语音识别 python 深度学习
PM60 系列智能语音集成电路.doc
2022-07-03 21:05:02 119KB 技术资料
用于 open_stt 数据集的 PyTorch E2E ASR 用于训练语音识别任务的语言和声学模型的最少脚本集。 训练管道包括以下阶段: 基于字符的RNN语言模型 具有 CTC 损失的 CNN-RNN 声学模型 基于字符的 RNN 语言模型和具有 RNN-T 损失的 CNN-RNN 声学模型 使用强化学习和 RNN-T 损失进行微调 结果 下表显示了。 阶段 模型 失利 更新 核证减排量 世界范围内 1 LM 行政长官 2407000 2 是 反恐委员会 216850 19.9 57.0 3 LM+AM 循环神经网络 108425 21.7 45.6 4 LM+AM 强化学习 300 19.2 43.9 要求 PyTorch >= 1.3(带有错误修复 ) 预处理 基于 log mel 滤波器组的声学模型,带有 40 个大小为 25 毫秒的滤波器,
1