变压器-TTS Pytorch实现 与众所周知的saco2seq模型(如tacotron)相比,该模型的训练速度快约3至4倍,并且合成语音的质量几乎相同。 通过实验确认,每步花费约0.5秒。 我没有使用波网声码器,而是使用tacotron的CBHG模型学习了后网络,并使用griffin-lim算法将频谱图转换为原始波。 要求 安装python 3 安装pytorch == 0.4.0 安装要求: pip install -r requirements.txt 数据 我使用了LJSpeech数据集,该数据集由成对的文本脚本和wav文件组成。 完整的数据集(13,100对)可在下载。 我将和用作预处理代码。 预训练模型 您可以 下载预训练的模型(AR模型为160K,Postnet为100K) 在检查点/目录中找到预训练的模型。 注意图 约15k步后出现对角线对齐。 以下注意图以16
2022-07-14 15:19:35 1.51MB text-to-speech deep-learning pytorch tts
1
共振峰语音合成算法研究和实现.pdf
2022-07-11 09:11:39 1.95MB 文档资料
android应用源码基于讯飞语音的中文语音合成.zip
2022-07-11 09:08:51 1.24MB 安卓
基于PaddlePaddle实现的语音合成工具,包含GUI界面操作和Web接口,以及简单示例。 视频教程:https://www.bilibili.com/video/BV1G34y1s744
2022-06-30 16:06:07 422.7MB 语音合成 paddlepaddle fastspeech2 tacotron2
语音合成功能: 由在线语音合成与离线语音合成两部分组成。 1.在线语音合成使用:讯飞语音和百度语音; 2.离线语音合成使用:微软TTS语音引擎。 您可以根据您的使用环境与需求灵活配置切换使用。 使用在线语音合成(网络发音人) 无需再另外配置安装发音人组件,只要您的电脑能连网,直接运行朗读女,选择对应在线发音人后,即可流畅合成并播放出您要朗读的文本内容。 使用离线语音合成 必须先安装对应的发音人组件(语音库)才能够朗读文本。直接将发音人软件安装到电脑后就能使用。可扩展性强:凡是符合微软TTS语音引擎标准的任何一款发音人软件产品安装后都可以被朗读女软件调用来朗读文本内容。
2022-06-20 17:42:41 5.25MB 语音 TTS
1
语音合成软件,语音播报,已破解永久使用!使用时请关闭360,以免误报!
2022-06-20 17:39:24 7.86MB 语音合成
1
PHP在线文字转语音合成源码 基于百度API开发
2022-06-18 13:04:43 1.35MB php
讯飞的语音合成jar包,例子以及API文档
2022-06-06 17:20:28 14.14MB TTS语音合成
1
微软TTS文本转语音引擎的确是非常NB,合成语音非常接近真人,应该是当前同类产品中体验最好的,官网有提供在线语音合成,但不提供合成后的音频文件下载,使用时会比较麻烦,所以写成工具。下载地址https://www.null119.cn/index.php/archives/162/
1
基于百度AI,在C#中实现图像识别、语音识别和语音合成的操作。软件一共三个界面,主界面,图像识别界面,语音处理界面。其中图像识别界面功能包括通用、植物、动物、车型、logo商标、菜品识别。语音识别界面功能包括录音、语音识别和语音合成
2022-06-01 20:39:51 11.14MB 图像识别 语音识别 语音合成 C#
1