思科VG224模拟语音网关 固件vg224-i6s-mz.124-24.T8.bin
2024-05-20 09:58:09 20.7MB
1
CASIA语音情感语料库,共包括四个专业发音人,六种情绪生气(angry)、高兴(happy)、害怕(fear)、悲伤。4个人(2男2女),50个句子,6种情绪,即不同人对相同的文本赋以不同的情感来阅读,这些语料可以用来对比分析不同情感状态下的声学及韵律表现。
2024-05-18 18:16:50 56.08MB 人工智能 语音识别 情绪识别
1
离线文字转语音——Overtone - Realistic AI Offline Text to Speech (TTS)
2024-05-17 14:50:19 225.58MB 人工智能 Unity
1
医疗器械报警语音(依据法规9706.108-2021)
2024-05-16 17:25:28 64KB 医疗器械
1
13.语音旁边-电影配音.mp4
2024-05-10 11:09:52 33.61MB
1
MS-TTS影视解说配音工具神器 解锁版 微软TTS文本转语音引擎的确是非常NB,合成语音非常接近真人,应该是当前同类产品中体验最好的,官网有提供在线语音合成,但不提供合成后的音频文件下载,使用时会比较麻烦,所以写成工具。 注意 1、记得先解压,且解压保存文件夹完整路径不能包含空格、英文小括号等特殊字符,否则将导致无法合并。 2、如果可以,请使用管理员模式运行程序! 3、简单模式-超长文本:导入的txt文件编码必须为utf-8,文件大小不要超过5MB; 4、试听功能:试听范围为主体内容前150字符; 5、SSML模式:试听模式主体内容长度不得超过150字符,合成模式主体内容长度不得超过2500字符; 更新内容: 1.9.5 1、界面大小可自行调整; 2、Edge接口数据汉化; 3、角色数量增加到20个; 4、恢复强制更新。(原因请自行理解) 5、其它bug修复 1.9.5.1 稳定性修复 1.9.5.2 微软接口wav格式无法合并bug修复 1.9.5.3 修复“Invalid characters in file name”
2024-05-09 18:16:56 30.1MB
1
包含声学模型和语言模型两个部分组成,两个模型都是基于神经网络。 该项目实现了GRU-CTC中文语音识别声音模型,所有代码都在gru_ctc_am.py中,包括: 增加了基于科大讯飞DFCNN的CNN-CTC结构的中文语音识别模型cnn_ctc_am.py,与GRU相比,对网络结构进行了稍加改造。 完全使用DFCNN框架搭建声学模型,稍加改动,将部分卷积层改为inception,使用时频图作为输入,cnn_with_fbank.py。 新增使用pluse版数据集的模型,cnn_with_full.py,建议直接训练这个模型。 语言模型 - language_model文件夹下 新增基于CBHG结构的语言模型language_model\CBHG_lm.py,该模型之前用于谷歌声音合成,移植到该项目中作为基于神经网络的语言模型。
2024-05-07 18:47:06 34.52MB 神经网络 深度学习 语音识别
1
基于单片机的智能语音识别系统设计-毕业设计-论文.doc
2024-05-01 11:04:34 862KB
1
C51单片机+HX711模块+JQ8900-16P语音模块电子体重秤设计(带语音播报)程序源码+文档资料. main() { delay(200); while(busy); SendData(0x0a); SendData(0x01); SendData(0x06);SendData(0x0b);while(!busy);while(busy); SendData(0x0a); SendData(0x01); SendData(0x05);SendData(0x0b);while(!busy);while(busy); password(); init_1602(); get_maopi(); delay(100); flag=1; while(1) { gei_weight(); if(key==0) { write_n(kg); write_kgg(shiwu); if(flag==1) bobao(); } kg++;if(kg>999)kg=0; delay(10); scankey(); }
2024-04-30 16:33:56 11.54MB HX711模块