上传者: 42131705
|
上传时间: 2022-03-26 21:55:31
|
文件大小: 6.84MB
|
文件类型: -
内部实施韵律转移电子可控整流器
作者=“通王”版本=“ 0.1”
该项目旨在实现韵律转移Tacotron,这是一种具有多GPU和多cpus的文本到语音的深度神经网络。 请阅读这些文章以获取更多详细信息。
要求
numpy = 1.14.2 Scipy = 1.0.1 Matplotlib = 2.0.2
TensorFlow = 1.6.0(gpu版本)
资料准备
在开始阶段,我们使用LJ语音数据集训练了模型。 ( )
由于LJ语音数据集是公开可用的,因此最近在TTS任务中被广泛用作基准数据集。 它有24小时质量合格的样品。
请下载LJSppech数据集的文件“ meta.csv”并将其保存在“ data / all”,并将所有带有后缀“ .wav”的音频文件保存在“ data / all / wavs”中
要生成spectrogrom文件,请运行以下命令,$ python