Maix-SpeechRecognizer:使用Maixduino框架和PlatfomIO开发的语音识别或唤醒单词检测演示,可在Sipeed的Maix开发板上的K210 MCU上运行
2021-10-17 22:46:20 17KB arduino ai speech-recognition wakeword
1
DeepSpeech-pytorch 使用DeepSpeech模型的PyTorch中的端到端语音识别模型 怎么跑 首先,安装依赖项 # clone project git clone https://github.com/jiwidi/DeepSpeech-pytorch # install project cd DeepSpeech-pytorch pip install -e . pip install -r requirements.txt 准备运行! 执行: python train . py #Will run with default parameters and donwload the datasets in the local directory Tensorboard日志将保存在runs/文件夹下 该模型 该模型是DeepSpeech 2的从在人的变化
1
Fundamental of speech recognition是Lawrence Rabiner 和Biing-hwang Juang编写的语音识别方面的权威著作,很经典。
2021-09-12 07:36:00 13.29MB 语音识别
1
RNN-换能器语音识别 在Tensorflow 2.0中使用RNN-Transducer进行端到端语音识别 概述 该语音识别模型基于Google的研究论文,并使用Tensorflow 2.0在Python 3中实现。 设置您的环境 要设置您的环境,请运行以下命令: git clone --recurse https://github.com/noahchalifour/rnnt-speech-recognition.git cd rnnt-speech-recognition pip install tensorflow==2.2.0 # or tensorflow-gpu==2.2.0 for GPU support pip install -r requirements.txt ./scripts/build_rnnt.sh # to setup the rnnt loss 共同的
1
MASR中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目。 原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构在Facebook在2016年提出的Wav2letter。但是使用的激活函数不是ReLU HardTanh ,而不是GLU (门控线性单元)。因此根据我的实验,使用GLU的收敛速度比HardTanh要快。如果您想要研究卷积网络用于语音识别的效果,这个项目可以作为一个参考。 以下用字错误率CER来假定模型的表现,CER =编辑距离/句子长度,越低越好 大致可以理解为1-CER就是识别准确率。 模型使用AISHELL-1数据集训练,共150小时的录音,覆盖了4000多个汉字。工业界使用的语音识别系统通常使用至少10倍于本项目的录音数据来训练,同时使用特定场景的语料来训练语言模型,所以,不要期待本项目可以
1
Unity插件。语音识别(离线版)插件。支持中文、英文、俄语、法语、阿拉伯语等19种语言。支持多平台(PC、移动端)。
2021-08-18 17:43:23 48.76MB Unity 语音识别 离线 Unity插件
解析深度学习-语音识别实践-英文版,没有找到中文版的
2021-08-08 07:12:07 7.53MB asr
1
Fundamentals of Speech Recognition 语音识别基本原理 高清晰影印版 资源源自台湾
2021-07-30 15:17:06 12.66MB 语音识别
1
使用 Visual Studio 2010,这是一个有效的 .net 语音识别迷你应用程序。 (( 样本 ))
2021-07-19 10:03:23 134KB 开源软件
1
Automatic Speech Recognition A Deep Learning Approach Dong Yu Li Deng
2021-07-07 22:12:57 5.82MB 语音识别 深度学习
1