MASR 中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目,本项目是基于 进行开发的。本项目已暂停维护,推荐使用识别效果更好的企业级模型 。 模型原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构类似于Facebook在2016年提出的Wav2letter,只使用卷积神经网络(CNN)实现的语音识别。但是使用的激活函数不是ReLU或者是HardTanh,而是GLU(门控线性单元)。因此称作门控卷积网络。根据实验结显示,使用GLU的收敛速度比HardTanh要快。 以下用字错误率CER来衡量模型的表现,CER = 编辑距离 / 句子长度,越低越好,大致可以理解为 1 - CER 就是识别准确率。 安装环境 执行requirements.txt安装依赖环境,在安装过程中出现Pyaudio安装错误,可以先执行su
2021-11-04 12:01:42 240KB cnn pytorch asr deepspeech
1
wenet数据集.开源版 本,超 过20000小时(2万小时以上),可以用来训练自动语音识别以及声纹识别。
2021-10-27 21:06:39 216B asr wenet
1
深度学习语音数据集,timit数据集(全套),解压后600m,自己毕设用过,已经处理过可以直接用,wav格式
2021-09-06 09:10:50 407.3MB 数据 语音 深度学习 timit
CMU多语种语音数据集:700多种语言的语音/文本对齐语料
2021-08-17 15:07:46 91.1MB Python开发-机器学习
1
里面包含了480个纯语音数据,分别包含48个人的10段语音,24男24女,每段语音3-6秒
2021-08-16 16:37:58 17.35MB 语音 数据集 人工智能 语音数据集
1
timit语音数据集
2021-07-28 10:09:30 342.65MB 声纹识别 语音识别 VAD ASR
1
大小:833 MB 版本:zh-CN_31h_2019-12-10 总验证小时数:26 总综合小时数:31 许可协议:CC-0 录音人数:963 音频格式:MP3 分割 口音: 11% 出生地:31 上海市 7% 出生地:33 浙江省 ... 年龄 40% 19 - 29 19% 30 - 39 ... 性别 64% 男 10% 女
2021-07-15 09:50:32 833.16MB 语音数据集 汉语 CommonVoice
1
语音数据集下载地址,永久有效。近几年来语音识别技术得到了迅速发展,从手机中的Siri语音智能助手、微软的小娜以及各种平台的智能音箱等等,各种语音识别的项目得到了广泛应用。语音识别属于感知智能,而让机器从简单的识别语音到理解语音,则上升到了认知智能层面,机器的自然语言理解能力如何,也成为了其是否有智慧的标志,而自然语言理解正是目前难点。
2021-06-03 22:43:56 90B 语音识别
1
480个纯语音数据,包含48个人的10段语音,24男24女,每段语音3-6秒
2019-12-21 21:48:46 17.35MB 纯语音
1