las-pytorch:聆听,参与和拼写E2E ASR模型。 在Pytorch中实施

上传者: 42136837 | 上传时间: 2022-05-22 20:41:55 | 文件大小: 177KB | 文件类型: ZIP
LAS-Pytorch 这是我的(LAS)谷歌ASR深度学习模型的pytorch实现。 我同时使用了mozilla 数据集和数据集。 借助torchaudio,在加载文件的同时即可快速完成功能转换。 结果 由于我的GPU没有足够的内存,因此这是采用相当小的体系结构进行的4个训练周期的LER(信笺错误率)和损失度量。 侦听器具有128个神经元和2层,而Speller具有256个神经元和2层。 我们可以看到模型如何从我们提供给它的数据中学习,但是它仍然需要更多的训练和适当的架构。 字母错误率 失利 如果我们尝试预测音频样本,则结果如下所示: true_y :['A','N','D',','S','T','I','L','L',','N','O',' ','A','T','T','E','M','P','T',','B','Y','','T','H ','E','','P','O']

文件下载

资源详情

[{"title":"( 20 个子文件 177KB ) las-pytorch:聆听,参与和拼写E2E ASR模型。 在Pytorch中实施","children":[{"title":"las-pytorch-master","children":[{"title":".gitignore <span style='color:#111;'> 34B </span>","children":null,"spread":false},{"title":"requirements.txt <span style='color:#111;'> 149B </span>","children":null,"spread":false},{"title":"model","children":[{"title":"las_model.py <span style='color:#111;'> 11.85KB </span>","children":null,"spread":false}],"spread":true},{"title":".github","children":[{"title":"workflows","children":[{"title":"codeql-analysis.yml <span style='color:#111;'> 2.53KB </span>","children":null,"spread":false},{"title":"main.yml <span style='color:#111;'> 1.06KB </span>","children":null,"spread":false}],"spread":true}],"spread":true},{"title":"utils","children":[{"title":"functions.py <span style='color:#111;'> 4.69KB </span>","children":null,"spread":false},{"title":"download_data.py <span style='color:#111;'> 2.58KB </span>","children":null,"spread":false},{"title":"prepare_librispeech.py <span style='color:#111;'> 9.57KB </span>","children":null,"spread":false},{"title":"prepare_common-voice.py <span style='color:#111;'> 5.45KB </span>","children":null,"spread":false},{"title":"data.py <span style='color:#111;'> 5.65KB </span>","children":null,"spread":false}],"spread":true},{"title":"README.md <span style='color:#111;'> 3.31KB </span>","children":null,"spread":false},{"title":"config","children":[{"title":"common_voice-config.yaml <span style='color:#111;'> 1.74KB </span>","children":null,"spread":false},{"title":"librispeech-config.yaml <span style='color:#111;'> 1.82KB </span>","children":null,"spread":false}],"spread":true},{"title":".pylintrc <span style='color:#111;'> 178B </span>","children":null,"spread":false},{"title":"img","children":[{"title":"las.png <span style='color:#111;'> 121.28KB </span>","children":null,"spread":false},{"title":"ler.png <span style='color:#111;'> 17.09KB </span>","children":null,"spread":false},{"title":"loss.png <span style='color:#111;'> 20.37KB </span>","children":null,"spread":false}],"spread":true},{"title":"solver","children":[{"title":"__pycache__","children":[{"title":"solver.cpython-36.pyc <span style='color:#111;'> 2.72KB </span>","children":null,"spread":false}],"spread":true},{"title":"solver.py <span style='color:#111;'> 3.50KB </span>","children":null,"spread":false}],"spread":true},{"title":"train.py <span style='color:#111;'> 8.31KB </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明