语音克隆 IPYNB笔记本用于语音克隆项目 请查看 ,我已遵循此仓库。
2024-03-26 19:56:51 254KB JupyterNotebook
1
人工智能深度学习,语音克隆项目 Bert-vits2项目,目前效果最完美的开源TTS项目 版本号:2.3 文件包括,模型本体G_6000.pth 配置文件config.json 天童爱丽丝语音模型,语言:日语,训练步数:6000 语气韵律完美,抑扬顿挫,语笑嫣然,自然流畅,适合作为小说阅读、口播、口替等功能领域。 请勿用于非法用途,也不得用作商业领域。
2024-01-18 16:52:56 576.78MB 深度学习 bert
1
声音克隆5秒克隆你的声音 (代码)声音克隆5秒克隆你的声音 (代码)声音克隆5秒克隆你的声音 (代码)声音克隆5秒克隆你的声音 (代码)声音克隆5秒克隆你的声音 (代码)声音克隆5秒克隆你的声音 (代码)
2022-10-16 21:05:10 885.53MB 语音克隆
基于序列的语音克隆系统,内含预训练模型、环境搭建教程,可以docker部署
2022-05-31 09:12:05 378.91MB 文档资料 语音克隆 clone
基于迁移学习的语音克隆系统包含数据集及教程
2022-05-31 09:12:04 761.47MB 迁移学习 文档资料 人工智能 机器学习
含搭建教程以及部署指南,可以快速部署声音克隆系统,实现对中英文的声音克隆
2022-05-06 20:05:13 379.84MB 深度学习 人工智能 语音克隆 语音复制
CycleGAN-VC3-PyTorch | 该代码是PyTorch的纸上实现: ,这是有关语音转换/语音克隆的工作。 数据集 风投 用法 训练 例子 演示版 参考 循环GAN-VC3 非并行语音转换(VC)是一种无需使用并行语料库即可学习源语音和目标语音之间的映射的技术。 最近,CycleGAN-VC [3]和CycleGAN-VC2 [2]在此问题上已经显示出令人鼓舞的结果,并已被广泛用作基准测试方法。 但是,由于CycleGAN-VC / VC2对mel谱图转换的有效性不明确,即使比较方法采用mel谱图作为转换目标,它们也通常用于mel-cepstrum转换。 为了解决这个问题,我们研究了CycleGAN-VC / VC2对梅尔谱图转换的适用性。 通过初步实验,我们发现它们的直接应用损害了在转换过程中应保留的时频结构。 为了解决这个问题,我们提出了CycleGAN-V
2022-03-24 20:29:51 388KB pytorch gan voice-conversion cyclegan
1
实时语音克隆 该存储库是使用实时工作的声码器实现的(SV2TTS)的实现。 如果您好奇或正在寻找我未记录的信息,请随时检查。 通常,我建议您快速浏览一下引言之外的数字。 SV2TTS是一个三阶段的深度学习框架,它允许从几秒钟的音频中创建语音的数字表示,并使用它来调节经过训练的文本到语音模型,以推广到新的语音。 视频演示(单击图片): 已实施文件 网址 指定 标题 实施源 SV2TTS 将学习从演讲者验证转移到多演讲者语音合成 这个回购 WaveRNN(声码器) 高效的神经音频合成 Tacotron 2(合成器) 基于梅尔谱图预测的条件波网自然合成TTS GE2E(编码器)
2021-10-01 07:30:19 955KB python deep-learning tensorflow pytorch
1
语音克隆模型
2021-08-25 14:11:22 805.12MB 语音克隆模型
CycleGAN-VC2-PyTorch | 这段代码是用于纸张的PyTorch实现: ,是有关语音转换/语音克隆的工作。 数据集 风投 中国男性演讲者(AISHELL 和) 用法 训练 例子 演示版 参考 更新 2020.11.17 :修复的问题:重新实施第二步的逆向损失。 2020.08.27 :通过添加第二步的逆向性损失 循环GAN-VC2 为了推进非并行VC的研究,我们提出了CycleGAN-VC2,它是CycleGAN-VC的改进版本,结合了三种新技术:改进的目标(两步对抗损失),改进的生成器(2-1-2D CNN) )和改进的鉴别器(GAN修补程序)。 该存储库包含: 实施本文的。 ,可用于创建缓存。 来训练模型。 -训练后转换的结果。 目录 要求 pip install -r requirements.txt 用法 预处理 python pre
2021-06-08 10:23:53 87.12MB deep-learning speech-synthesis gan deeplearning
1