整合阿里云进行文本转语音(Springboot+vue),前后端都有,每次可以将文本转化为你想要的的语音,mp3等格式,阿里云语音支持包括山东化,四川话,天津话,广播腔,英文,美式,英式,日语、等国家的语音。配合开发文档很容易整合进你的项目。文档连接:https://blog.csdn.net/lllmmm13/article/details/126446983?spm=1001.2014.3001.5501
2023-03-02 23:32:29 16KB 源代码
1
该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含transformer、CBHG,数据集包含stc、primewords、Aishell、thchs30四个数据集。 本项目现已训练一个迷你的语音识别系统,将项目下载到本地上,下载 thchs 数据集并解压至 data,运行 test.py,不出意外能够进行识别,结果如下: the 0 th example. 文本结果: lv4 shi4 yang2 chun1 yan1 jing3 da4 kuai4 wen2 zhang1 de di3 se4 si4 yue4 de lin2 luan2 geng4 shi4 lv4 de2 xian1 huo2 xiu4 mei4 shi1 yi4 ang4 ran2 原文结果: lv4 shi4 yang2 chun1 yan1 jing3 da4 kuai4 wen2 zhang1 de di3 se4 si4 yue4 de lin2 luan2 geng4 shi4 lv4 de2 xi
2023-03-02 18:14:02 108.36MB 语音识别 深度学习 语音 识别
1
语音识别 使用Web Speech API的语音识别 Web Speech API的SpeechRecognition接口是识别服务的控制器接口; 这也处理从识别服务发送的SpeechRecognitionEvent。 您可以在这里查看项目
2023-03-02 16:59:03 3KB JavaScript
1
Pocketsphinx.js 是一个在浏览器上通过纯 JavaScript 实现语音识别的功能,支持 Chrome 和 Firefox 浏览器。提供录音的功能。 特性: 100% 纯 JavaScript API, 可通过 Web Workers 录制 支持 PocketSphinx 所支持的所有声音模型 支持大多数 PocketSphinx 的命令行参数 支持 JavaScript 有限状态语法 FSG 输入 支持在编译时的来自文件的统计语言模型 支持键盘监测 可用于实时识别的可选音频录制库
2023-03-02 10:54:21 4.68MB pocketsphinx.js
1
深度学习方法及应用——深度学习和语音识别领域专家、微软研究院邓力博士和俞栋博士原著.rar 深度学习方法及应用——深度学习和语音识别领域专家、微软研究院邓力博士和俞栋博士原著.rar 深度学习方法及应用——深度学习和语音识别领域专家、微软研究院邓力博士和俞栋博士原著.rar
2023-03-01 16:30:51 19.68MB 深度学习
1
Asterisk1.6 最全的中文语音
2023-03-01 11:39:41 29.49MB Asterisk
1
针对语音处理问题对离散小波变换及其性质进行了研究,给出了作为语音处理的小波函数及时间因子(a,b)必须满足的条件.利用离散小波变换对语音信号的基音提取、频谱分析和清/浊音分割进行了分析.结果表明,小波变换能准确地提取基音和清/浊音分割,并具有较好的稳健性.
2023-02-28 15:34:50 264KB 自然科学 论文
1
鲁棒语音识别是为了解决噪声环境所引起的语音识别系统识别和训练不匹配的情况. 依据噪声对语音识别系统的影响,从信号空间、特征空间及模型空间3 个层面上分别对语音增强技术、特征增强技术及语音模型补偿、增强技术进行了总结,并分析了不同方法的特点、实现及应用.
2023-02-27 23:52:20 784KB 自然科学 论文
1
语音量化误差的计算,很简单的小测试程序,对于语音量化的同学来说不错
2023-02-27 23:44:49 2KB matlab 语音量化误差
1
Flite: a small run-time speech synthesis engine version 2.1-release Copyright Carnegie Mellon University 1999-2018 All rights reserved http://cmuflite.org https://github.com/festvox/flite Flite是一个开源的小型快速运行文本到语音引擎。 它是免费软件综合工具套件的最新成员,其中包括爱丁堡大学的Festival语音综合系统和卡内基梅隆大学的FestVox项目,用于构建综合声音的工具,脚本和文档。 但是,flite本身不需要这些系统中的任何一个即可进行编译和运行。 核
2023-02-27 22:14:36 19.63MB 系统开源
1