消费税
再现:样式标记:端到端语音合成中的无监督样式建模,控制和传输( )
Python和工具包版本
Python: '3.5.2'
numpy: '1.13.1'
tensorflow: '1.4'
样本和预训练模型
在可以找到样本,进行了两种实验:
参考音频条件:
BZ_440K.wav是在Blizzard2013上训练的模型的推理结果,为440K步长(batch_size = 16),调节的参考音频是从其测试集中选取的。
LJ_448K.wav是在LJ_Speech上训练的模型的另一个推论结果,为448K步长(batch_size = 16),调节的参考音频也从其测试集中选取。
消费税的组合:
normal.wav和slow.wav是在LJ_Speech上训练的模型的两个推断结果,两者之间的区别是通过选择不同的样式标记进行样式嵌入。
high.w
1