上传者: 42122340
|
上传时间: 2021-11-27 21:56:29
|
文件大小: 16KB
|
文件类型: -
用于单通道语音分离的深度聚类
“用于分割和分离的深度聚类判别嵌入”的实现
要求
参见
用法
在.yaml文件中配置实验,例如: train.yaml
训练:
python ./train_dcnet.py --config conf/train.yaml --num-epoches 20 > train.log 2>&1 &
推理:
python ./separate.py --num-spks 2 $mdl_dir/train.yaml $mdl_dir/final.pkl egs.scp
实验
配置
时代
调频
FF
毫米
FF /毫米
AVG
25
11.42
6.85
7.88
7.36
9.54
问与答
.scp文件的格式?
wav.scp文件的格式遵循kaldi工具箱中的定义。 每行包含一个key value对,其中key是索引音频文件的唯一字符串,而值