Hey-Jetson:基于深度学习的自动语音识别,关注Nvidia Jetson-源码

上传者: 42171208 | 上传时间: 2021-11-04 17:57:23 | 文件大小: 1.87GB | 文件类型: -
嘿,杰森! 自动语音识别推理 布莱斯·沃克(Brice Walker) 该项目在Keras / Tensorflow中构建了一个可扩展的,基于注意力的语音识别平台,以便在Edge上针对AI的Nvidia Jetson嵌入式计算平台进行推理。 自动语音识别的这种实际应用是受我以前在心理健康领域的职业启发的。 该项目开始了为构建实时治疗干预推断和反馈平台的旅程。 最终目的是构建一个工具,该工具可以为治疗师提供有关其干预效果的实时反馈,但是设备上的语音识别在移动,机器人或其他不希望基于云的深度学习的领域中具有许多应用。 该项目的重点是应用数据科学而不是学术研究。 最终的生产模型由一个深度神经网络组成,该网络具有3层扩张的卷积神经元,7层双向递归神经元(GRU细胞),一个单注意层和2层时间分布的密集神经元。 该模型利用了CTC损失函数,Adam优化器,批量归一化,扩张卷积,递归辍学,双向层和基于注意的机制。 该模型在Nvidia GTX1070(8G)GPU上进行了30个时期的训练,总训练时间约为6.5天。 该模型的预测与测试集中的地面真实转录的整体余弦相似度约为78%(验证集中为80%)

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明