演讲
语音是一个开放源代码包,用于构建用于自动
语音识别的端到端模型。 当前支持关注的序列到序列模型,连接器时间分类和RNN序列转换器。
该软件的目的是促进
语音识别的端到端模型的研究。 这些模型在PyTorch中实现。
该软件仅在Python3.6中经过测试。
我们不会为Python2.7提供向后兼容性。
安装
我们建议创建一个虚拟环境并在其中安装python要求。
virtualenv
source /bin/activate
pip install -r requirements.txt
然后按照适用于您的计算机的版本的安装说明进行操作。
安装所有python需求后,从顶层目录运行:
make
构建过程需要CMake以及Make。
之后,从仓库根目录获取setup.sh 。
source setup
1