Overtone 是 Unity 的离线文本转语音资产。 使用 15 种以上的语言、900 多种英语语音、快速的性能和跨平台支持来丰富您的游戏。 资源仅供研究学习使用,若要商用请到资源商店购买https://assetstore.unity.com/packages/tools/generative-ai/overtone-realistic-ai-offline-text-to-speech-tts-251304
2024-11-07 18:01:14 301.29MB unity 人工智能
1
离线文字转语音——Overtone - Realistic AI Offline Text to Speech (TTS)
2024-05-17 14:50:19 225.58MB 人工智能 Unity
1
React本地TTS React Native TTS是用于iOS,Android和Windows上的的文本到语音库。 文献资料 安装 npm install --save react-native-tts react-native link react-native-tts 用法 进口货 import Tts from 'react-native-tts' ; 视窗 在windows/myapp.sln将RNTTS项目添加到您的解决方案中: 在Visual Studio 2019中打开解决方案 右键单击解决方案资源管理器中的“解决方案”图标>添加>现有项目 选择node_modules\react-native-tts\windows\RNTTS\RNTTS.vcxproj 在windows/myapp/myapp.vcxproj添加引用RNTTS到您的主应用程序项目。 从Visu
2024-04-01 09:47:06 352KB Java
1
TTS Text-to-speech(文字转语音)服务C#源码
2022-08-20 22:11:22 13.63MB tts
1
eSpeak NG文字转语音 eSpeak NG是一款紧凑的开源软件文本到语音合成器,适用于Linux,Windows,Android和其他操作系统。 它支持。 它基于乔纳森·达丁顿(Jonathan Duddington)创建的eSpeak引擎。 eSpeak NG使用“共振峰合成”方法。 这允许以小尺寸提供许多语言。 语音清晰,可以高速使用,但不如基于人类语音记录的大型合成器那么自然或流畅。 它还支持Klatt共振峰合成,以及使用MBROLA作为后端语音合成器的功能。 eSpeak NG的提供方式如下: 一个程序(Linux和Windows),用于说出文件或stdin中的文本。 供其他程序使用的版本。 (在Windows上,这是一个DLL)。 Windows的SAPI5版本,因此可以与屏幕阅读器和其他支持Windows SAPI5界面的程序一起使用。 eSpeak NG已被
2022-07-14 15:38:17 14.71MB android text-to-speech speech-synthesis espeak
1
变压器-TTS Pytorch实现 与众所周知的saco2seq模型(如tacotron)相比,该模型的训练速度快约3至4倍,并且合成语音的质量几乎相同。 通过实验确认,每步花费约0.5秒。 我没有使用波网声码器,而是使用tacotron的CBHG模型学习了后网络,并使用griffin-lim算法将频谱图转换为原始波。 要求 安装python 3 安装pytorch == 0.4.0 安装要求: pip install -r requirements.txt 数据 我使用了LJSpeech数据集,该数据集由成对的文本脚本和wav文件组成。 完整的数据集(13,100对)可在下载。 我将和用作预处理代码。 预训练模型 您可以 下载预训练的模型(AR模型为160K,Postnet为100K) 在检查点/目录中找到预训练的模型。 注意图 约15k步后出现对角线对齐。 以下注意图以16
2022-07-14 15:19:35 1.51MB text-to-speech deep-learning pytorch tts
1
详解Android SDK1.6中Text-To-Speech(TTS)语音朗读
2022-07-09 09:10:22 34KB 文档资料
定位相关的Tacotron 的PyTorch实现。 音频样本可以在找到。 可以在找到Colab演示。 图1: Tacotron(具有动态卷积注意)。 图2:示例梅尔谱图和注意图。 快速开始 确保您已安装Python 3.6和PyTorch 1.7或更高版本。 然后安装此软件包(以及): pip install tacotron univoc 用法示例 import torch import soundfile as sf from univoc import Vocoder from tacotron import load_cmudict , text_to_id , Tacotron # download pretrained weights for the vocoder (and optionally move to GPU) vocoder = Vocoder .
2022-05-18 18:11:43 1021KB text-to-speech pytorch tts speech-synthesis
1
Glow-TTS:通过单调对齐搜索生成文本到语音的生成流 金在贤,金成元,江Jung和尹旭 在我们最近的,我们提出了Glow-TTS:通过单调对齐搜索从文本到语音的生成流。 最近,已经提出了文本到语音(TTS)模型,例如FastSpeech和ParaNet,用于从文本中并行生成梅尔频谱图。 尽管具有优势,但是如果没有自回归TTS模型作为其外部调整器的指导,则无法训练并行TTS模型。 在这项工作中,我们提出了Glow-TTS,这是一种基于流的并行TTS生成模型,不需要任何外部对准器。 通过将流和动态编程的特性相结合,所提出的模型自行搜索文本和语音的潜在表示之间最可能的单调对齐方式。 我们证明,强制执行硬单调对齐方式可以使鲁棒的TTS泛化为长话,而使用生成流则可以实现快速,多样化和可控制的语音合成。 Glow-TTS在合成时具有可比较的语音质量,比自回归模型Tacotron 2快了一个数量级
2022-03-11 18:01:56 1.62MB text-to-speech deep-learning pytorch tts
1
为微软SAPI(Text-to-Speech API)封装的类 有研究或探讨或开源的请加群:37424970 或联系本人MSN或邮箱:zhuseahui@yahoo.com.cn
2022-01-04 15:14:41 72KB 微软 SAPI 封装
1