包含声学模型和语言模型两个部分组成,两个模型都是基于神经网络。 该项目实现了GRU-CTC中文语音识别声音模型,所有代码都在gru_ctc_am.py中,包括: 增加了基于科大讯飞DFCNN的CNN-CTC结构的中文语音识别模型cnn_ctc_am.py,与GRU相比,对网络结构进行了稍加改造。 完全使用DFCNN框架搭建声学模型,稍加改动,将部分卷积层改为inception,使用时频图作为输入,cnn_with_fbank.py。 新增使用pluse版数据集的模型,cnn_with_full.py,建议直接训练这个模型。 语言模型 - language_model文件夹下 新增基于CBHG结构的语言模型language_model\CBHG_lm.py,该模型之前用于谷歌声音合成,移植到该项目中作为基于神经网络的语言模型。
2024-05-07 18:47:06 34.52MB 神经网络 深度学习 语音识别
1
资源包含文件:设计报告word+源码及数据 该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括 CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含 transformer、CBHG,数据集包含 stc、primewords、Aishell、thchs30 四个数据集。 声学模型采用 CTC 进行建模,采用 CNN-CTC、GRU-CTC、FSMN 等模型 model_speech,采用 keras 作为编写框架。 详细介绍参考:https://biyezuopin.blog.csdn.net/article/details/122512802?spm=1001.2014.3001.5502
该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含transformer、CBHG,数据集包含stc、primewords、Aishell、thchs30四个数据集。 本项目现已训练一个迷你的语音识别系统,将项目下载到本地上,下载 thchs 数据集并解压至 data,运行 test.py,不出意外能够进行识别,结果如下: the 0 th example. 文本结果: lv4 shi4 yang2 chun1 yan1 jing3 da4 kuai4 wen2 zhang1 de di3 se4 si4 yue4 de lin2 luan2 geng4 shi4 lv4 de2 xian1 huo2 xiu4 mei4 shi1 yi4 ang4 ran2 原文结果: lv4 shi4 yang2 chun1 yan1 jing3 da4 kuai4 wen2 zhang1 de di3 se4 si4 yue4 de lin2 luan2 geng4 shi4 lv4 de2 xi
2023-03-02 18:14:02 108.36MB 语音识别 深度学习 语音 识别
1
Python基于深度学习的中文语音识别系统源码.zip
2022-05-25 15:09:01 5.82MB python 源码软件 深度学习 语音识别
使用Keras、TensorFlow基于深度卷积神经网络和长短时记忆神经网络、注意力机制以及CTC实现的中文语音识别系统
2021-12-02 12:19:38 6.5MB 中文语音识别系统
1
ASRT:基于深度学习的中文语音识别系统 ASRT是一个基于深度学习的中文语音识别系统,如果您觉得喜欢,请点一个“ Star”吧〜 自述语言|中文版| | |||| 如果程序运行期间或使用中有什么问题,可以及时在issue中提出来,我将尽快进行响应。本项目作者交流QQ群: 894112051 提问前请仔细查看,以及避免重复提问 以下问题AI柠檬博主和群友可能会拒绝回答,包括但不限于: 询问已经写在ASRT语音识别项目文档和问题上解决过的已知重复问题。 找不到重点,不知所云的问题,但不声明任何其他信息。 跟ASRT项目没有直接相关的问题 “伸手党”类的问题 请注意,开发者并没有义务回复您的问
2021-12-01 10:00:16 6.5MB python tensorflow keras cnn
1
A Deep-Learning-Based Chinese Speech Recognition System 基于深度学习的中文语音识别系统
2021-05-07 15:34:49 6.49MB Python开发-机器学习
1