资源包含文件:设计报告word+源码及数据 该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括 CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含 transformer、CBHG,数据集包含 stc、primewords、Aishell、thchs30 四个数据集。 声学模型采用 CTC 进行建模,采用 CNN-CTC、GRU-CTC、FSMN 等模型 model_speech,采用 keras 作为编写框架。 详细介绍参考:https://biyezuopin.blog.csdn.net/article/details/122512802?spm=1001.2014.3001.5502
mixly语音识别库文件加固件.rar
2023-04-20 11:16:10 2.63MB ardunio
1
UE5免费的语音识别解决方案,后期免费使用。 文章介绍: https://blog.csdn.net/Highning0007/article/details/125348385
2023-04-19 14:05:28 101B UE5 语音识别
LD3320加STM32F103C8T6智能灯控,PWM调光,语音识别
2023-04-19 09:43:36 5.16MB stm32 语音识别 ld3320
1
用c#编写的基于百度的语音识别小项目,可以把本地的音频文件转化为文字,没有录音功能和实时在线转化功能
2023-04-18 16:02:03 343KB C#
1
1 oled显示屏 2 LD3320语言识别 3 红外测温模块 4 语音播报模块 5 步进电机驱动 6 舵机控制
2023-04-13 00:44:50 122.57MB 语音识别
1
CASR-DEMO(中文自动语音识别演示系统) 关于本项目的一些说明 首先,欢迎大家关注项目,进行学习研究。收到一些小伙伴的问题我就集中回答下,这里是demo的源码,有两个版本其一是称为speech_env,这是一个简单的语音识别功能,界面如下面的效果图一;还有一个是V2.0的目录,这个版本功能比较齐全,界面如效果图二。有一点项目只在win10平台上测试过,其他不保证能不能运行。由于月久失更,有些依赖包可能需要修改,不过应该都是小问题,根据实际过程的报错信息修复就行。再次感谢大家的关注! 最新整理了两个版本的发布版 speech_env(效果图一) speechV2.0基于第三方接口实现语音识别和语音合成,说话人识别功能(效果图二) 微信:LHH754086474 于2019年12月25日更新。
2023-04-09 19:54:11 116.98MB 系统开源
1
制作的是一个机器人,能够识别任意人的说话语音,而且能够自己修改识别的语音而进行二次开发。
2023-04-09 14:40:17 287KB 非特定人语音识别
1
1分钟搞定配音,免费短视频配音,文字转语音,语音合成,自媒体、软件集成都可以用!
2023-04-09 02:17:34 1.93MB 语音识别
1