PPASR中文语音识别(最终级)模型(大数据集训练的),源码地址:https://github.com/yeyupiaoling/PPASR
PPASR中文语音识别(进阶级)模型(aishell数据集训练的),源码地址:https://github.com/yeyupiaoling/PPASR/tree/%E8%BF%9B%E9%98%B6%E7%BA%A7
1
使用Keras、TensorFlow基于深度卷积神经网络和长短时记忆神经网络、注意力机制以及CTC实现的中文语音识别系统。
2021-12-02 12:19:38 6.5MB 中文语音识别系统
1
ASRT:基于深度学习的中文语音识别系统 ASRT是一个基于深度学习的中文语音识别系统,如果您觉得喜欢,请点一个“ Star”吧〜 自述语言|中文版| | |||| 如果程序运行期间或使用中有什么问题,可以及时在issue中提出来,我将尽快进行响应。本项目作者交流QQ群: 894112051 提问前请仔细查看,以及避免重复提问 以下问题AI柠檬博主和群友可能会拒绝回答,包括但不限于: 询问已经写在ASRT语音识别项目文档和问题上解决过的已知重复问题。 找不到重点,不知所云的问题,但不声明任何其他信息。 跟ASRT项目没有直接相关的问题 “伸手党”类的问题 请注意,开发者并没有义务回复您的问
2021-12-01 10:00:16 6.5MB python tensorflow keras cnn
1
MASR 中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目,本项目是基于 进行开发的。本项目已暂停维护,推荐使用识别效果更好的企业级模型 。 模型原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构类似于Facebook在2016年提出的Wav2letter,只使用卷积神经网络(CNN)实现的语音识别。但是使用的激活函数不是ReLU或者是HardTanh,而是GLU(门控线性单元)。因此称作门控卷积网络。根据实验结显示,使用GLU的收敛速度比HardTanh要快。 以下用字错误率CER来衡量模型的表现,CER = 编辑距离 / 句子长度,越低越好,大致可以理解为 1 - CER 就是识别准确率。 安装环境 执行requirements.txt安装依赖环境,在安装过程中出现Pyaudio安装错误,可以先执行su
2021-11-04 12:01:42 240KB cnn pytorch asr deepspeech
1
PPASR中文语音识别(最终级)模型(thchs30数据集训练的),源码地址:https://github.com/yeyupiaoling/PPASR
2021-10-14 12:08:32 614.57MB paddlepaddle 语音识别 asr deepspeech2
1
PPASR中文语音识别(最终级)模型(free_st_chinese_mandarin_corpus数据集训练的),源码地址:https://github.com/yeyupiaoling/PPASR
2021-10-14 12:08:23 574.47MB paddlepaddle 语音识别 asr DeepSpeech2
1
PPASR中文语音识别(最终级)模型(aishell数据集训练的),源码地址:https://github.com/yeyupiaoling/PPASR
2021-10-13 19:08:50 613.22MB paddlepaddle 语音识别 asr 深度学习
1
PaddlePaddle实现的DeepSpeech2模型,训练free_st_chinese_mandarin_corpus数据集训练的模型,源码地址:https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech
1
MASR中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目。 原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构在Facebook在2016年提出的Wav2letter。但是使用的激活函数不是ReLU HardTanh ,而不是GLU (门控线性单元)。因此根据我的实验,使用GLU的收敛速度比HardTanh要快。如果您想要研究卷积网络用于语音识别的效果,这个项目可以作为一个参考。 以下用字错误率CER来假定模型的表现,CER =编辑距离/句子长度,越低越好 大致可以理解为1-CER就是识别准确率。 模型使用AISHELL-1数据集训练,共150小时的录音,覆盖了4000多个汉字。工业界使用的语音识别系统通常使用至少10倍于本项目的录音数据来训练,同时使用特定场景的语料来训练语言模型,所以,不要期待本项目可以
1