论文复习 语音识别论文综述·NLP·语音合成 年 纸 链接 2006/06 Connectionist Temporal Classification: Labelling UnsegmentedSequence Data with Recurrent Neural Networks 2015/06 Attention-Based Models for Speech Recognition 2015/08 Listen, Attend and Spell 2016/09 Joint CTC-Attention based End-to-End Speech Recognition using Multi-task Learning 2017/07 Attention Is All You Need 2018/10 BERT: Pre-training of Deep Bidir
2022-12-13 14:09:23 863KB nlp speech speech-synthesis speech-recognition
1
一个python编写的将文字转换成语音的程序,可以当广播用。所需要的外接库:baidu-api
2022-12-12 18:46:10 3KB 语音识别 python
1
AI文字转语音,支持多种人声选择,在线生成一键导出【电脑永久版】
2022-12-05 14:27:35 68.44MB AI 文字转语音 语音识别 永久使用
1
1.给大家带来一款语音识别软件,想做智能识别语音设备或者想给项目增加功能的同学可以看下 2.这款软件是使用python写的,其实开发语言无所谓用其他语言也可以写 3.代码还是挺简单的
2022-12-05 14:04:08 2KB 语音识别 软件 智能设备 编程语言
1
基于卷积神经网络的语音识别声学模型的项目源码.zip基于卷积神经网络的语音识别声学模型的项目源码.zip基于卷积神经网络的语音识别声学模型的项目源码.zip 声学模型介绍 1) DCNN-CTC声学模型介绍 该模型主要是在speech_model-05上进行修改,上述模型主要使用DCNN-CTC构建语音识别声学模型,STcmds 数据集也是仿照该模型进行修改,最后实验结果如上图所示; 2) MCNN-CTC声学模型介绍 该模型主要是在speech_model_10 脚本上进行实验,最终实验结果可在上图2)所示结果,最终MCNN-CTC总体实验结果相较于DCNN-CTC较好; 3) DenseNet-CTC声学模型介绍 上述模型主要是在 DenseNet上进行实验,最终实验在Thchs30数据集结果可以达到接近30%左右的CER,具体实验可以自己付尝试一下; 4) Attention-CTC声学模型 此模型主要在DCNN-CTC基础上,在全连接层进行注意力操作,最终结果相较于其他结果相较于DCNN-CTC可能有提升,具体可以参看speech_model_06脚本;
用VB6.0编写的语音识别源代码,很有参照性,对于初学语音识别很有启发性.
2022-11-30 16:39:16 27KB VB 语音 识别 源码
1
科大讯飞语音识别SDK的ROS包修改
2022-11-27 20:02:44 5.48MB 语音识别 科大讯飞 ROS
1
语音识别专利技术发展现状与未来趋势,可用于语言识别等方面论文的参考
2022-11-25 12:26:53 2.36MB 语音识别
1
NXP MCU级别的本地语音控制解决方案利用i.MX RT106L来实现,该方案可以使开发者更方便和快速地将本地语音命令添加到他们的产品。这个超小尺寸,集成软件算法和硬件的方案,可以方便开发者进行快速的评估和概念验证开发。在智能音响,智能家居等产品开发中,开发者可使用示例中的指令集和唤醒词,也可以向NXP申请创建自定义指令集和唤醒词。这个解决方案上缩短了上市时间,降低了风险并减少了开发工作,可以使众多OEM工厂轻松地将语音指令添加到其智能家居和智能设备中去,无需连接wifi和云,从而解决了很多消费者的隐私问题。  i.MX RT106L是i.MX RT1060系列的成员,将于2020年4月份正
1
包括 AISHELL-1_sample数据集 和词典
2022-11-24 20:02:44 98.82MB 语音识别 kaldi aishell1数据集
1