上传者: 42131618
|
上传时间: 2022-11-15 16:34:08
|
文件大小: 24KB
|
文件类型: ZIP
非官方的Lip2Wav数据集预处理脚本
数据集是大规模的语音合成语音数据集。 该脚本允许下载和预处理数据集的各个部分,并且运行速度更快。 例如,要仅运行dl测试,只需为以下所有步骤指定--splits test --speakers dl 。
要求
该脚本需要ffmpeg ,并已在Ubuntu 20.04.1 LTS上进行了测试。
安装
pip install git+https://github.com/enhuiz/lip2wav-dataset.git
脚步
1.从YouTube下载原始视频
在一个空文件夹下,运行以下命令:
lip2wav-dataset download --splits test --speakers dl
此步骤将自动下载指定的扬声器并进行分割(即,训练/验证/测试)。 如果未指定,则将下载所有扬声器/分离器。
2.将原始视频切成间隔
lip2wav-dat