Pytorch实现的流式与非流式语音识别模型(数据集:free_st_chinese_mandarin_corpus),源码地址为:https://github.com/yeyupiaoling/MASR
2021-12-27 10:06:54 505.19MB deepspeech 语音识别 asr pytorch
1
Pytorch实现的流式与非流式语音识别模型(数据集:AIShell),源码地址为:https://github.com/yeyupiaoling/MASR
2021-12-26 17:10:29 507.42MB asr 语音识别 pytorch deepspeech
1
Pytorch实现的流式与非流式语音识别模型(数据集:thchs30),源码地址为:https://github.com/yeyupiaoling/MASR
2021-12-26 17:10:29 492.35MB asr 语音识别 DeepSpeech2 pytorch
1
电话机器人对接语音识别模块,直接在Freeswitch客户端运行 load mod_asr即可。欢迎添加微信:15011395541 进行交流。 本模块为对接阿里云ASR 2.0的识别接口,通过sdk方式对接Freeswitch软交换系统,从而将语音流送给语音识别服务器,并将返回结果通过event的方式发送出来。
2021-12-23 19:40:12 113KB 电话机器人 语音识别 ASR 语音客服
1
docker-kaldi-gstreamer-server kaldi 。 概要 此 dockerfile 自动构建主服务器和工作服务器,这些服务器在来自 Tanel Alumäe 的解释,并由他自己在。 使用此项目,您将能够在几分钟内运行自动语音识别 (ASR) 服务器。 注意力 这里将设置的 ASR 服务器需要一些。 在我将在下面详细介绍的 docker 图像中,不包含 kaldi 模型。 您的机器上必须有这些模型。 您还必须有一个描述这些模型的 yaml 文件。 请、和查看一些示例,以了解如何编写您自己的 yaml 文件。 有一些 kaldi 模型可供下载。 我测试了我的设置与此,这是英语。 我正在尝试为巴西葡萄牙语构建模型,但直到现在我还没有找到足够的免费/开放资源。 安装码头工人 请参考 。 获取图像 从 Docker Hub 拉取镜像(~ 900MB): docke
2021-12-20 21:38:51 461KB docker kaldi asr kaldi-gstreamer-server
1
DNN-Speech-Recognition - 基于深度神经网络的自动语音识别器,首先搭建几个简单网络进行尝试,然后根据测试结果来构建自己的深度神经网络模型。可用于机器学习/深度学习/自然语言处理等方面课程的课程项目。数据集是LibriSpeech的部分数据,不包含在此压缩包中,可以自行下载。
2021-12-02 18:44:56 1.8MB DNN ASR
1
基于BERT的ASR纠错-附件资源
2021-11-26 13:52:24 23B
1
爱丁堡大学2020 ASR语音识别课程 PPT
2021-11-24 12:08:46 34.43MB 语音识别
1
端到端ASR综述:《Recent Advances in End-to-End Automatic Speech Recognition》
2021-11-09 17:21:51 5.84MB ASR论文
1
MASR 中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目,本项目是基于 进行开发的。本项目已暂停维护,推荐使用识别效果更好的企业级模型 。 模型原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构类似于Facebook在2016年提出的Wav2letter,只使用卷积神经网络(CNN)实现的语音识别。但是使用的激活函数不是ReLU或者是HardTanh,而是GLU(门控线性单元)。因此称作门控卷积网络。根据实验结显示,使用GLU的收敛速度比HardTanh要快。 以下用字错误率CER来衡量模型的表现,CER = 编辑距离 / 句子长度,越低越好,大致可以理解为 1 - CER 就是识别准确率。 安装环境 执行requirements.txt安装依赖环境,在安装过程中出现Pyaudio安装错误,可以先执行su
2021-11-04 12:01:42 240KB cnn pytorch asr deepspeech
1