VoxCeleb教练 该存储库包含用于培训演讲者识别模型的框架,该文章在“捍卫说话者识别的度量学习”一文中进行了描述。 依存关系 pip install -r requirements.txt 资料准备 以下脚本可用于下载和准备VoxCeleb数据集以进行培训。 python ./dataprep.py --save_path data --download --user USERNAME --password PASSWORD python ./dataprep.py --save_path data --extract python ./dataprep.py --save_path data --convert 为了使用数据扩充,还运行: python ./dataprep.py --save_path data --augment 除Python依赖项外,必须在系统上安装wg
1
Voxceleb1数据集中的说话人验证任务 该存储库包含使用Kaldi在Voxceleb1 [1]数据集上训练i-vector说话者识别系统的简单脚本。 它是根据Kaldi / egs / sre10上的run.sh文件修改的。 要求 卡尔迪工具包 如何使用 将所有文件移至{kaldi_root} / egs / sre10文件夹 修改run.sh文件中的数据集目录和参数以适合您的计算机。 运行run.sh文件 结果 使用voxceleb1训练数据对2048个组件GMM-UBM和600维i-vector提取器进行了训练,以进行验证任务。 与Kaldi egs上的sre10基线相比,训练参数几乎相同。 GMM-2048 CDS有效值:15.39% GMM-2048 LDA + CDS eer:8.103% GMM-2048 PLDA eer:5.446% 笔记 Voxceleb1数据集是
1