LEAF:可学习的音频前端
LEAF是诸如mel-filterbanks之类的音频功能的可学习替代品,可以将其初始化为mel-filterbanks的近似值,然后在使用少量参数的情况下针对手头的任务进行训练。
提供了该系统的完整说明。
依存关系
Python 3.8
内容
该库包含Tensorflow / Keras代码,用于:
LEAF前端以及mel- , 和
适用于 , 和
一个使用gin的示例训练循环,以在tensorflow数据集上训练具有各种前端和架构的模型。
安装
在仓库的根目录中,运行:
pip3 install -e .
创建一个叶子前端
我们提供可学习的固定前端作为Keras模型。 如本文所述,使用默认参数实例化Leaf将构建一个LEAF前端,其窗口大小为25ms,窗口步长为10ms,sPCEN作为压缩函数,并在mel-scale上初始化过滤器。 为了方便起见
2021-10-23 13:56:26
373KB
Python
1