500条WAV格式的中文语音数据集,可用于中文语音识别模型的测试集,好的一批
2023-08-14 10:02:25 45.69MB python 数据集 nlp 深度学习
1
3000+小时的中文普通话语音数据集,可用于语音识别训练,使用地址:https://github.com/yeyupiaoling/PPASR
2022-11-17 19:27:14 292B 中文语音数据集 语音识别 PPASR
解压打开文件后可以看到两个文件夹,一个是音频文件一个是标签文件,可以根据自己的需要将数据集任意的操作
2022-04-06 16:12:27 421.5MB 中文语音数据集
1
MASR 中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目,本项目是基于 进行开发的。本项目已暂停维护,推荐使用识别效果更好的企业级模型 。 模型原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构类似于Facebook在2016年提出的Wav2letter,只使用卷积神经网络(CNN)实现的语音识别。但是使用的激活函数不是ReLU或者是HardTanh,而是GLU(门控线性单元)。因此称作门控卷积网络。根据实验结显示,使用GLU的收敛速度比HardTanh要快。 以下用字错误率CER来衡量模型的表现,CER = 编辑距离 / 句子长度,越低越好,大致可以理解为 1 - CER 就是识别准确率。 安装环境 执行requirements.txt安装依赖环境,在安装过程中出现Pyaudio安装错误,可以先执行su
2021-11-04 12:01:42 240KB cnn pytorch asr deepspeech
1