RNN-换能器语音识别 在Tensorflow 2.0中使用RNN-Transducer进行端到端语音识别 概述 该语音识别模型基于Google的研究论文,并使用Tensorflow 2.0在Python 3中实现。 设置您的环境 要设置您的环境,请运行以下命令: git clone --recurse https://github.com/noahchalifour/rnnt-speech-recognition.git cd rnnt-speech-recognition pip install tensorflow==2.2.0 # or tensorflow-gpu==2.2.0 for GPU support pip install -r requirements.txt ./scripts/build_rnnt.sh # to setup the rnnt loss 共同的
1
Microsoft.Speech.dll,Win7系统微软TTS语音修复
2021-08-27 16:03:13 101.1MB Speech
1
icassp2019-latex-template:ICASSP 2019官方乳胶模板
2021-08-26 16:27:11 112KB latex conference signal-processing speech
1
SEGAN:语音增强生成对抗网络 介绍 这是SEGAN项目的存储库。 我们的原始文件可以在找到,并且测试样本可以。 在这项工作中,采用了一种对抗性生成方法,以一种完全卷积的体系结构来进行语音增强(即从损坏的语音信号中去除噪声),如下所示: 该模型处理处于不同SNR的许多噪声条件下的原始语音波形(训练时为40,测试时为20)。 它还可以对来自混合在同一结构中的许多说话者的语音特征进行建模(无需任何身份监督),这使得生成的结构在噪声和说话者维度上具有普遍性。 所有项目都是使用TensorFlow开发的。 关于GAN的定义和部署,有两个很好的参考资料库: GAN:实施改进以更稳定的方式训练G
1
里面都是干货啊,这种比较好的文档肯定是英文的,好东西还要多看几遍才能掌握i
2021-08-23 19:42:32 29.46MB 语音, 机器学习
1
MASR中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目。 原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构在Facebook在2016年提出的Wav2letter。但是使用的激活函数不是ReLU HardTanh ,而不是GLU (门控线性单元)。因此根据我的实验,使用GLU的收敛速度比HardTanh要快。如果您想要研究卷积网络用于语音识别的效果,这个项目可以作为一个参考。 以下用字错误率CER来假定模型的表现,CER =编辑距离/句子长度,越低越好 大致可以理解为1-CER就是识别准确率。 模型使用AISHELL-1数据集训练,共150小时的录音,覆盖了4000多个汉字。工业界使用的语音识别系统通常使用至少10倍于本项目的录音数据来训练,同时使用特定场景的语料来训练语言模型,所以,不要期待本项目可以
1
Unity插件。语音识别(离线版)插件。支持中文、英文、俄语、法语、阿拉伯语等19种语言。支持多平台(PC、移动端)。
2021-08-18 17:43:23 48.76MB Unity 语音识别 离线 Unity插件
Microsoft Speech SDK 5.1 Ghost 阉割版语音转换和识别补丁 TTS Speech Recgnize
2021-08-18 10:38:01 66.35MB Micros Micros Micros
1
用C#开发语音识别系统,基于微软speech SDK开发的程序,学习微软语音识别SDK开发的好案例。是源码奥!
2021-08-15 21:50:42 116KB C# 语音识别 speech SDK
1
windows下语音识别动态连接库,通过c#直接引用即可使用简单语音识别与文本朗读功能,可实现基本的语音控制与交互。
2021-08-14 14:29:44 268KB windows语音识别
1