A Chinese Deep Speech Recognition System 包括基于深度学习的声学模型和基于深度学习的语言模型
2022-03-07 09:53:25 108.32MB 深度学习
1
中文语音识别项目程序
1
狮身人面像4 Sphinx4是纯Java语音识别库。 它提供了一个快速简便的API,借助CMUSphinx声学模型将语音记录转换为文本。 它可以在服务器和桌面应用程序中使用。 除了语音识别之外,Sphinx4还有助于识别说话者,改编模型,将现有转录与音频对齐以进行时间戳记等。 演示sphinx4源代码中包含许多示例演示,以使您了解如何运行sphinx4。 您可以从sphinx4-samples jar运行它们: 转录器-演示如何转录文件对话框-演示如何与用户引导对话框SpeakerID-扬声器识别Aligner-音频到转录时间戳的演示
2021-12-14 15:45:42 45.35MB Java
1
灵感来自 Fabien Petitcolas 的模型 1 演示 ( http://www.petitcolas.net/fabien/software/mpeg/ )
2021-11-08 11:07:22 9KB matlab
1
该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含transformer、CBHG,数据集包含stc、primewords、Aishell、thchs30四个数据集。
2021-10-27 18:59:13 108.36MB Python开发-自然语言处理
1
SE-MCNN-CTC的中文语音识别声学模型
2021-07-19 09:01:29 1.6MB 语音识别 模型 SE-MCNN-CTC
1
采用端到端方法构建声学模型,以字为建模单元,采用DCNN-CTC网络结构
2021-07-06 13:49:48 798KB Python开发-机器学习
1
基于卷积神经网络的语音识别声学模型的研究
2021-03-08 14:36:26 7.68MB Python开发-机器学习
1
以建立维吾尔语连续音素识别基础平台为目标,在HTK(基于隐马尔可夫模型的工具箱)的基础上,首次研究了其语言相关环节的几项关键技术;结合维吾尔语的语言特征,完成了用于语言模型建立和语音语料库建设的维吾尔语基础文本设计;根据具体技术指标,录制了较大规模语音语料库;确定音素作为基元,训练了维吾尔语声学模型;在基于字母的N-gram语言模型下,得出了从语音句子向字母序列句子的识别结果;统计了维吾尔语32个音素的识别率,给出了容易混淆的音素及其根源分析,为进一步提高识别率奠定了基础。
1
sphinx4需要使用连续的声学模型,官网上下载下来的中文声学模型全是半连续的,这里提供能够在sphinx4中使用的中文声学模型
2019-12-21 19:58:16 13.69MB sphinx4 中文命令词 java 语音识别
1