parallel-wavenet-vocoder:基于WaveNet的声码器可进行快速推理

上传者: 42131798 | 上传时间: 2022-07-26 15:03:03 | 文件大小: 779KB | 文件类型: ZIP
并行WaveNet声码器 概述 这是一个实验项目,建立了一个基于WaveNet的声码器,该声码器在论文的启发下将梅尔频谱图并行转换为原始波。 由于非自回归模型之一的的结构,我们能够并行生成顺序数据。 由于在最大似然估计中无法直接直接对IAF模型进行优化,从而无法找到合适的最优值,因此难以一概而论,因此,本文引入了一种替代方法,即概率密度蒸馏。 它预先训练原始的WaveNet(教师),然后通过最小化两个概率之间的KL差异来优化IAF模型(学生)以对相似的输出概率进行建模。 如果再想一想,我们可以得出结论,“自回归”损失被强加给IAF模型,IAF模型本身就是非自回归模型。 这意味着,在训练序列生成模型时,“自回归”约束仍然是关键。 为了优化模型,我只尝试了简单模型(MLE),因为我对设计替代模型的动机感到好奇。 总之,在我的案例中,在没有自回归约束的情况下优化IAF模型几乎是不可行的。

文件下载

资源详情

[{"title":"( 19 个子文件 779KB ) parallel-wavenet-vocoder:基于WaveNet的声码器可进行快速推理","children":[{"title":"parallel-wavenet-vocoder-master","children":[{"title":"train.py <span style='color:#111;'> 3.09KB </span>","children":null,"spread":false},{"title":"hparams","children":[{"title":"default.yaml <span style='color:#111;'> 1.35KB </span>","children":null,"spread":false},{"title":"hparams.yaml <span style='color:#111;'> 1.18KB </span>","children":null,"spread":false}],"spread":true},{"title":"generate_multi.py <span style='color:#111;'> 403B </span>","children":null,"spread":false},{"title":"generate.py <span style='color:#111;'> 2.64KB </span>","children":null,"spread":false},{"title":"utils.py <span style='color:#111;'> 183B </span>","children":null,"spread":false},{"title":"materials","children":[{"title":"iaf.png <span style='color:#111;'> 323.46KB </span>","children":null,"spread":false},{"title":"loss.png <span style='color:#111;'> 258.74KB </span>","children":null,"spread":false},{"title":"parallel_wavenet.png <span style='color:#111;'> 227.53KB </span>","children":null,"spread":false}],"spread":true},{"title":"requirements.txt <span style='color:#111;'> 98B </span>","children":null,"spread":false},{"title":"models.py <span style='color:#111;'> 7.06KB </span>","children":null,"spread":false},{"title":"modules.py <span style='color:#111;'> 17.96KB </span>","children":null,"spread":false},{"title":"LICENSE <span style='color:#111;'> 1.05KB </span>","children":null,"spread":false},{"title":"tools","children":[{"title":"data_prepro_parallel.py <span style='color:#111;'> 3.14KB </span>","children":null,"spread":false}],"spread":true},{"title":"README.md <span style='color:#111;'> 3.85KB </span>","children":null,"spread":false},{"title":"audio.py <span style='color:#111;'> 10.38KB </span>","children":null,"spread":false},{"title":".gitignore <span style='color:#111;'> 82B </span>","children":null,"spread":false},{"title":"hparam.py <span style='color:#111;'> 1.97KB </span>","children":null,"spread":false},{"title":"data_load.py <span style='color:#111;'> 2.21KB </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明