深度学习基于全卷积神经网络的语音识别系统源代码。
本项目使用基于卷积神经网络实现。 通过下载复制以后,需要将datalist目录下的文件全部拷贝到dataset目录下,也就是将其跟数据集放在一起。
$ cp -rf datalist/* dataset/
目前可用的模型有24、25和251
本项目开始训练请执行:
$ python3 train_mspeech.py
本项目开始测试请执行:
$ python3 test_mspeech.py iters_num (这里的iters_num为迭代的step数,可以在生成的step_dfcnn.txt文件里查看)
测试之前,请确保代码中填写的模型文件路径存在。
ASRT API服务器启动请执行:
$ python3 asrserver.py
Model 模型
Speech Model 语音模型
CNN + LSTM/GRU + CTC
Language Model 语言模型
基于概率图的最大熵隐马尔可夫模型
About Accuracy 关于准确率