包含:Retinex算法最为经典的4篇文献: 单尺度Retinex(SSR)、多尺度Retinex(MSR)、基于变分框架的Retinex、以及自适应平滑的Retinex。读完这些将彻底了解Retinex的理论,变化及改进。
2021-12-29 20:05:24 3.97MB SSR MSR ASR等
1
Pytorch实现的流式与非流式语音识别模型(数据集:free_st_chinese_mandarin_corpus),源码地址为:https://github.com/yeyupiaoling/MASR
2021-12-27 10:06:54 505.19MB deepspeech 语音识别 asr pytorch
1
Pytorch实现的流式与非流式语音识别模型(数据集:AIShell),源码地址为:https://github.com/yeyupiaoling/MASR
2021-12-26 17:10:29 507.42MB asr 语音识别 pytorch deepspeech
1
Pytorch实现的流式与非流式语音识别模型(数据集:thchs30),源码地址为:https://github.com/yeyupiaoling/MASR
2021-12-26 17:10:29 492.35MB asr 语音识别 DeepSpeech2 pytorch
1
电话机器人对接语音识别模块,直接在Freeswitch客户端运行 load mod_asr即可。欢迎添加微信:15011395541 进行交流。 本模块为对接阿里云ASR 2.0的识别接口,通过sdk方式对接Freeswitch软交换系统,从而将语音流送给语音识别服务器,并将返回结果通过event的方式发送出来。
2021-12-23 19:40:12 113KB 电话机器人 语音识别 ASR 语音客服
1
docker-kaldi-gstreamer-server kaldi 。 概要 此 dockerfile 自动构建主服务器和工作服务器,这些服务器在来自 Tanel Alumäe 的解释,并由他自己在。 使用此项目,您将能够在几分钟内运行自动语音识别 (ASR) 服务器。 注意力 这里将设置的 ASR 服务器需要一些。 在我将在下面详细介绍的 docker 图像中,不包含 kaldi 模型。 您的机器上必须有这些模型。 您还必须有一个描述这些模型的 yaml 文件。 请、和查看一些示例,以了解如何编写您自己的 yaml 文件。 有一些 kaldi 模型可供下载。 我测试了我的设置与此,这是英语。 我正在尝试为巴西葡萄牙语构建模型,但直到现在我还没有找到足够的免费/开放资源。 安装码头工人 请参考 。 获取图像 从 Docker Hub 拉取镜像(~ 900MB): docke
2021-12-20 21:38:51 461KB docker kaldi asr kaldi-gstreamer-server
1
DNN-Speech-Recognition - 基于深度神经网络的自动语音识别器,首先搭建几个简单网络进行尝试,然后根据测试结果来构建自己的深度神经网络模型。可用于机器学习/深度学习/自然语言处理等方面课程的课程项目。数据集是LibriSpeech的部分数据,不包含在此压缩包中,可以自行下载。
2021-12-02 18:44:56 1.8MB DNN ASR
1
基于BERT的ASR纠错-附件资源
2021-11-26 13:52:24 23B
1
爱丁堡大学2020 ASR语音识别课程 PPT
2021-11-24 12:08:46 34.43MB 语音识别
1
端到端ASR综述:《Recent Advances in End-to-End Automatic Speech Recognition》
2021-11-09 17:21:51 5.84MB ASR论文
1