上传者: 42129005
|
上传时间: 2021-11-20 20:51:56
|
文件大小: 15.43MB
|
文件类型: -
加权自适应实例归一化的一键式语音转换
,*,*,,( 。
此仓库是的正式实现。
音频样本可在。
依存关系
python 3.6.0
pytorch 1.4.0
pyyaml 5.4.1
numpy的1.19.5
librosa 0.8.0
声音文件0.10.2
tensorboardX 2.1
预处理
在运行此项目之前,您需要先准备什么以及如何准备它们
我们使用作为声码器,并使用作为数据集。
如果您想运行我们的项目,请首先按照ParallelWaveGAN项目的说明进行安装。
然后像ParallelWaveGAN一样准备所有的Mel谱图数据。
准备speaker_used.json自己的文件,如./data/80_train_speaker_used.json和./data/fine_tune_speaker_used.json表演。
通过运行./convert