DeepSpeechDeepSpeech是一种开源嵌入式(离线,设备上的)语音到文本引擎,可以在从Raspberry Pi 4到大功率GPU服务器的各种设备上实时运行
2023-03-15 21:18:57 6.19MB machine-learning embedded deep-learning offline
1
Keras实现的 DeepSpeech 端到端语音识别
2022-04-02 09:43:35 503KB Python开发-机器学习
1
资源来自pypi官网,解压后可用。 资源全名:deepspeech_gpu-0.8.0a0-cp36-cp36m-win_amd64.whl
2022-02-10 10:02:51 17.31MB python 开发语言 后端 Python库
深语音 使用实现DeepSpeech2用于PyTorch。 该支持使用模型进行训练/测试和推断。 可选地,可以在推理时使用语言模型。 安装 需要安装几个库才能进行工作培训。 我将假定一切都已在Ubuntu的Anaconda安装中安装,并安装了PyTorch。 如果尚未安装,请安装 。 如果要解码以使用可选语言模型支持波束搜索,请安装ctcdecode: git clone --recursive https://github.com/parlance/ctcdecode.git cd ctcdecode && pip install . 最后克隆此仓库并在仓库中运行它: pip install -r requirements.txt pip install -e . # Dev install 如果您打算使用多节点训练,则需要etcd。 以下是在Ubuntu上安装的命令。 su
2022-01-12 16:07:47 63KB Python
1
Pytorch实现的流式与非流式语音识别模型(数据集:free_st_chinese_mandarin_corpus),源码地址为:https://github.com/yeyupiaoling/MASR
2021-12-27 10:06:54 505.19MB deepspeech 语音识别 asr pytorch
1
Pytorch实现的流式与非流式语音识别模型(数据集:AIShell),源码地址为:https://github.com/yeyupiaoling/MASR
2021-12-26 17:10:29 507.42MB asr 语音识别 pytorch deepspeech
1
DeepSpeech剧本 使用DeepSpeech训练语音识别模型的速成班。 快速链接 从这里开始。 本部分将设定您对DeepSpeech手册可以实现的目标的期望,以及开始训练自己的语音识别模型所需的先决条件。 了解了DeepSpeech Playbook可以实现的功能后,本节将概述DeepSpeech本身,其组成部分以及它与您过去使用过的其他语音识别引擎的不同之处。 之前,你可以训练一个模型,你需要收集和格式化数据的语料库。 本节概述了DeepSpeech所需的数据格式,并逐步介绍了从Common Voice准备数据集的示例。 如果您正在训练使用与英语不同的字母(例如带有变音符号的语言)的模型,那么您将需要修改alphabet.txt文件。 了解得分手的工作,以及如何建立自己的得分手。 了解DeepSpeech的声学模型和语言模型之间的差异,以及它们如何组合以提供端到端语音识别。 本节
1
MASR 中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目,本项目是基于 进行开发的。本项目已暂停维护,推荐使用识别效果更好的企业级模型 。 模型原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构类似于Facebook在2016年提出的Wav2letter,只使用卷积神经网络(CNN)实现的语音识别。但是使用的激活函数不是ReLU或者是HardTanh,而是GLU(门控线性单元)。因此称作门控卷积网络。根据实验结显示,使用GLU的收敛速度比HardTanh要快。 以下用字错误率CER来衡量模型的表现,CER = 编辑距离 / 句子长度,越低越好,大致可以理解为 1 - CER 就是识别准确率。 安装环境 执行requirements.txt安装依赖环境,在安装过程中出现Pyaudio安装错误,可以先执行su
2021-11-04 12:01:42 240KB cnn pytorch asr deepspeech
1
语音合成相关模型,使用地址:https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech/tree/master/tools/generate_audio 和 https://github.com/yeyupiaoling/PPasr/tree/master/tools/generate_audio
2021-10-25 16:09:17 392.32MB tts asr 语音合成 语音识别
1
DeepSpeech-pytorch 使用DeepSpeech模型的PyTorch中的端到端语音识别模型 怎么跑 首先,安装依赖项 # clone project git clone https://github.com/jiwidi/DeepSpeech-pytorch # install project cd DeepSpeech-pytorch pip install -e . pip install -r requirements.txt 准备运行! 执行: python train . py #Will run with default parameters and donwload the datasets in the local directory Tensorboard日志将保存在runs/文件夹下 该模型 该模型是DeepSpeech 2的从在人的变化
1