open_stt_e2e:PyTorch 端到端语音识别

上传者: 42124497 | 上传时间: 2022-07-03 11:20:59 | 文件大小: 16KB | 文件类型: ZIP
用于 open_stt 数据集的 PyTorch E2E ASR 用于训练语音识别任务的语言和声学模型的最少脚本集。 训练管道包括以下阶段: 基于字符的RNN语言模型 具有 CTC 损失的 CNN-RNN 声学模型 基于字符的 RNN 语言模型和具有 RNN-T 损失的 CNN-RNN 声学模型 使用强化学习和 RNN-T 损失进行微调 结果 下表显示了。 阶段 模型 失利 更新 核证减排量 世界范围内 1 LM 行政长官 2407000 2 是 反恐委员会 216850 19.9 57.0 3 LM+AM 循环神经网络 108425 21.7 45.6 4 LM+AM 强化学习 300 19.2 43.9 要求 PyTorch >= 1.3(带有错误修复 ) 预处理 基于 log mel 滤波器组的声学模型,带有 40 个大小为 25 毫秒的滤波器,

文件下载

资源详情

[{"title":"( 11 个子文件 16KB ) open_stt_e2e:PyTorch 端到端语音识别","children":[{"title":"open_stt_e2e-master","children":[{"title":"README.md <span style='color:#111;'> 1.85KB </span>","children":null,"spread":false},{"title":"features.py <span style='color:#111;'> 1.72KB </span>","children":null,"spread":false},{"title":"train_lm.py <span style='color:#111;'> 3.38KB </span>","children":null,"spread":false},{"title":"LICENSE <span style='color:#111;'> 1.04KB </span>","children":null,"spread":false},{"title":"train_rl.py <span style='color:#111;'> 5.61KB </span>","children":null,"spread":false},{"title":"utils.py <span style='color:#111;'> 700B </span>","children":null,"spread":false},{"title":"train_rnnt.py <span style='color:#111;'> 4.25KB </span>","children":null,"spread":false},{"title":"model.py <span style='color:#111;'> 9.69KB </span>","children":null,"spread":false},{"title":"utterances.py <span style='color:#111;'> 1.64KB </span>","children":null,"spread":false},{"title":"train_ctc.py <span style='color:#111;'> 3.82KB </span>","children":null,"spread":false},{"title":"data.py <span style='color:#111;'> 7.01KB </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明