MASR的V2版本训练Conformer模型文件,使用Fbank,Pytorch,训练数据为超大数据集,13000+小时。 源码地址:https://github.com/yeyupiaoling/MASR
2023-02-02 17:35:43 435.03MB pytorch asr 语音识别 wenetspeech
MASR中文语音识别模型 aishell (179小时)
2022-07-05 19:01:05 455.96MB MASR中文语音识别模型
1
MASR中文语音识别模型(数据集:Librispeech),源码地址:https://github.com/yeyupiaoling/MASR
2022-04-02 09:42:51 455.96MB 语音识别 人工智能 Librispeech pytorch
1
MASR中文语音识别模型(大数据集训练的),源码地址:https://github.com/yeyupiaoling/MASR
2022-01-10 16:11:05 546.58MB 语音识别 pytorch asr masr
MASR 中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目,本项目是基于 进行开发的。本项目已暂停维护,推荐使用识别效果更好的企业级模型 。 模型原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构类似于Facebook在2016年提出的Wav2letter,只使用卷积神经网络(CNN)实现的语音识别。但是使用的激活函数不是ReLU或者是HardTanh,而是GLU(门控线性单元)。因此称作门控卷积网络。根据实验结显示,使用GLU的收敛速度比HardTanh要快。 以下用字错误率CER来衡量模型的表现,CER = 编辑距离 / 句子长度,越低越好,大致可以理解为 1 - CER 就是识别准确率。 安装环境 执行requirements.txt安装依赖环境,在安装过程中出现Pyaudio安装错误,可以先执行su
2021-11-04 12:01:42 240KB cnn pytorch asr deepspeech
1
MASR中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目。 原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构在Facebook在2016年提出的Wav2letter。但是使用的激活函数不是ReLU HardTanh ,而不是GLU (门控线性单元)。因此根据我的实验,使用GLU的收敛速度比HardTanh要快。如果您想要研究卷积网络用于语音识别的效果,这个项目可以作为一个参考。 以下用字错误率CER来假定模型的表现,CER =编辑距离/句子长度,越低越好 大致可以理解为1-CER就是识别准确率。 模型使用AISHELL-1数据集训练,共150小时的录音,覆盖了4000多个汉字。工业界使用的语音识别系统通常使用至少10倍于本项目的录音数据来训练,同时使用特定场景的语料来训练语言模型,所以,不要期待本项目可以
1
中文语音识别,提供预训练模型,高识别率 Chinese Speech Recognition; Mandarin Automatic Speech Recognition;
2021-06-30 21:12:52 71KB Python开发-自然语言处理
1
基于Pytorch实现的MASR中文语音识别模型文件
2021-05-20 14:36:18 250.81MB pytorch 深度学习 人工智能 语音识别
1
基于Pytorch实现的MASR中文语音识别模型(1300小时数据集) 源码地址:https://github.com/yeyupiaoling/MASR
2021-03-29 11:13:40 244.21MB 语音识别 中文语音识别 pytorch 人工智能
该模型用项目地址https://github.com/binzhouchn/masr
2021-03-19 09:22:31 246.74MB pytorch masr speechrecog deeplearning
1