语音识别源码(java) ASR Speaker Recognition Enhanced Voice Conference ! Yancheng!Li,!Liang!Wei,!Zhaoyuan!Zhang
2021-09-16 20:21:43 1.29MB 语音识别 ASR
1
Pytorch 上的端到端语音识别 基于 Transformer 的语音识别模型 如果您在工作中使用了本工具包中包含的任何源代码,请引用以下论文。 Winata,GI,Madotto,A.,Wu,CS,&Fung,P.(2019年)。 使用来自并行句子的基于神经的合成数据的代码切换语言模型。 在第23届计算自然语言学习会议(CoNLL)的会议记录中(第271-280页)。 Winata, GI, Cahyawijaya, S., Lin, Z., Liu, Z., & Fung, P. (2019)。 使用 Low-Rank Transformer 的轻量级和高效的端到端语音识别。 arXiv 预印本 arXiv:1910.13923。 (被ICASSP 2020接受) Zhou, S., Dong, L., Xu, S., & Xu, B. (2018)。 使用 Transfor
2021-09-05 18:50:50 106KB end-to-end speech pytorch transformer
1
RNN-换能器语音识别 在Tensorflow 2.0中使用RNN-Transducer进行端到端语音识别 概述 该语音识别模型基于Google的研究论文,并使用Tensorflow 2.0在Python 3中实现。 设置您的环境 要设置您的环境,请运行以下命令: git clone --recurse https://github.com/noahchalifour/rnnt-speech-recognition.git cd rnnt-speech-recognition pip install tensorflow==2.2.0 # or tensorflow-gpu==2.2.0 for GPU support pip install -r requirements.txt ./scripts/build_rnnt.sh # to setup the rnnt loss 共同的
1
MASR中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目。 原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构在Facebook在2016年提出的Wav2letter。但是使用的激活函数不是ReLU HardTanh ,而不是GLU (门控线性单元)。因此根据我的实验,使用GLU的收敛速度比HardTanh要快。如果您想要研究卷积网络用于语音识别的效果,这个项目可以作为一个参考。 以下用字错误率CER来假定模型的表现,CER =编辑距离/句子长度,越低越好 大致可以理解为1-CER就是识别准确率。 模型使用AISHELL-1数据集训练,共150小时的录音,覆盖了4000多个汉字。工业界使用的语音识别系统通常使用至少10倍于本项目的录音数据来训练,同时使用特定场景的语料来训练语言模型,所以,不要期待本项目可以
1
C#讯飞语音识别代码,讯飞语音识别,讯飞C#语音sdk,C#语音识别
2021-08-12 10:11:17 1.78MB 讯飞语音识别 C#语音识别 C#讯飞sdk
1
Unity接入科大讯飞语音识别源码工程! 文章介绍链接在这:https://blog.csdn.net/zhangay1998/article/details/118973373
2021-07-22 20:10:25 1.65MB 语音识别 Unity 科大讯飞
1
好多人私聊说请教Qt如何编写语音识别的教程,因为时间关系,教程就不写了直接将语音识别源码上传
2021-07-07 17:12:30 8KB Qt 语音聊天 语音识别 百度语音
1
GMM_Digital_Voice_Recognition 基于GMM与MFCC特征进行数字0-9的语音识别,GMM,MFCC,语音识别,中文数据,sklearn,scikit-learn,数字语音识别。 预安装 conda create -n GMM -c anaconda python=3.6 numpy pyaudio scipy #也可以使用pip conda activate GMM pip install -r requirements.txt 数据链接: ://pan.baidu.com/s/124TiAs8m7Ioa2_3dUrxGSg提取码:xsfe 以下命令假设下载
1
语音测试 描述 这是一个示例应用程序,用于演示如何在AOSP(5.0 L)中集成iflytek SDK以实现中文语音识别 准备 在开始构建项目之前,我们需要做一些准备工作。 请参阅
2021-06-17 13:25:43 7KB Java
1
中文语音识别 1.环境 巨蟒:3.5 Tensorflow:1.5.0 2.训练数据下载 清华大学中文语料库(thchs30) 3.训练 配置conf目录下的conf.ini文件中的设定 在python train.py运行python train.py开始训练 在终端运行python test.py测试 也可以使用PyCharm打开 4.测试效果
1