人工智能深度学习,语音克隆项目 Bert-vits2项目,目前效果最完美的开源TTS项目 版本号:2.3 文件包括,模型本体G_6000.pth 配置文件config.json 天童爱丽丝语音模型,语言:日语,训练步数:6000 语气韵律完美,抑扬顿挫,语笑嫣然,自然流畅,适合作为小说阅读、口播、口替等功能领域。 请勿用于非法用途,也不得用作商业领域。
2024-01-18 16:52:56 576.78MB 深度学习 bert
1
语音识别模型,我自己写了一段代码,很好用,准确率百分之九十
这是用于语音转换的VQ-VAE模型的实现。 到目前为止,结果还不如DeepMind令人印象深刻(您可以找到其结果)。 我的估计是语音质量为2-3,清晰度为3-4(按5阶平均意见得分)。 欢迎捐款。 当前结果 音频样本 经过50万步训练(约2天)后的结果: 来源1: (我们消息感到鼓舞) 目标1: 资料来源2: (谁是神秘议员?) 目标2: 资料来源3: (在阿伯丁亚历克斯·弗格森(Alex Ferguson)的下,这是可以做到的。 目标3: 资料来源4: (那是一个艰辛的时刻。) 目标4: 笔记: 格式:[发言人] _ [句子] 作者没有在上指定目标演讲者。 演讲者空间 VQ-VAE学习的扬声器空间的PCA-2D(Tensorboard屏幕截图)。 请注意,性别是自然分开的,如Deep Voice 2的图4所示。 有趣的是, p280的性别未在VCTK发布的Spea
2022-02-16 13:14:43 155KB Python
1
CNN+CTC_tutorial.ipynb为语音模型的教程,详细介绍了搭建网络的一步步的操作。 LanguageModel2.py为基于统计的语言模型,dict.txt为统计的字典。
2021-09-25 20:24:17 9.28MB CNN+CTC_tutorial
1
包含mono、tri1、tri2、tri3a、tri4a、tri5a已训练好的mdl、fst等文件,不包含dnn训练结果
2021-07-22 22:06:56 76B kaldi aishell 语音识别 语音模型
1
这个资源分数特么为啥不能设置成0,抱歉了,最小只能选2 blog地址http://www.jianshu.com/p/51eb37d33418
2021-05-17 11:29:22 9.58MB 云知声
1