给大家分享一个freeswitch中文语音包,有需要的可以下载。
2021-09-16 20:36:56 10.53MB 语言包 freeswitch 中文语言包
1
TacotronV2 + WaveRNN update at 2020-10-3 添加微调分支 开源中文语音数据集(女声)训练中文,实现中文到声学特征(Mel)转换的声学模型。在GTA模式下,利用训练好的TacotronV2合成标贝语音数据集中中文对应的Mel特征,作为声码器的训练数据。在合成阶段,利用TactornV2和WaveRNN合成高质量、高自然度的中文语音。 从任选一个speaker的语音数据集,微调TacotronV2中的部分参数,实现说话人转换。 Tensorflow serving + Flask 部署TacotronV2中文语音合成服务。 由于中采用Location sensitive attention,对长句字的建模能力不好(漏读、重复),尝试了、、,能有效地解决对长句的建模能力,加快模型收敛速度。 tensorflow-gpu的版本为1.14.0 测试语音合成的效果
2021-09-14 09:42:54 158.96MB Python
1
基于人工智能的中文语音文本智能编辑系统设计.pdf
2021-09-07 14:06:03 1.54MB 智能系统 人工智能 系统开发 参考文献
PaddlePaddle实现的DeepSpeech2模型,训练free_st_chinese_mandarin_corpus数据集训练的模型,源码地址:https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech
1
语音情感识别
2021-08-22 13:16:42 59.19MB 语音情感识别
1
MASR中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目。 原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构在Facebook在2016年提出的Wav2letter。但是使用的激活函数不是ReLU HardTanh ,而不是GLU (门控线性单元)。因此根据我的实验,使用GLU的收敛速度比HardTanh要快。如果您想要研究卷积网络用于语音识别的效果,这个项目可以作为一个参考。 以下用字错误率CER来假定模型的表现,CER =编辑距离/句子长度,越低越好 大致可以理解为1-CER就是识别准确率。 模型使用AISHELL-1数据集训练,共150小时的录音,覆盖了4000多个汉字。工业界使用的语音识别系统通常使用至少10倍于本项目的录音数据来训练,同时使用特定场景的语料来训练语言模型,所以,不要期待本项目可以
1
PPASR中文语音识别(进阶级)模型(thchs30数据集训练的),源码地址:https://github.com/yeyupiaoling/PPASR/tree/%E8%BF%9B%E9%98%B6%E7%BA%A7
2021-08-16 09:14:25 607.29MB 深度学习 语音识别 paddlepaddle asr
1
常用5000 中文发音
2021-08-12 22:10:34 31.81MB 中文语音
pocketsphinx在windows下的中文语音识别 http://blog.csdn.net/itas109/article/details/78999477
2021-08-11 20:21:31 314KB 中文语音识别 pocketsphinx
1
微软中文语音库,安装即可使用。想做TTS项目的可以用来尝试一下
2021-08-09 14:57:41 2.4MB 语音库 微软语音 中文语音 Microsoft
1