基于深度学习的噪声抑制与语音识别系统源码+教程(毕业设计).zip 已获导师指导并通过的高分项目 下载后运行ASRT文件下的GUI.py即可 系统功能如下 1、噪声抑制: (1)提供对音频进行转换成频谱图,让用户分析起来更加直观。 (2)可以进行录音,并将录进的音频内容保存到指定的文件夹中。 (3)同时可以对录进的音频进行添加噪音,添加研究内容。 (4)可以对录制的音频进行降噪处理,使录进的音频听起来更加清晰。 (5)可以将处理后的音频播放出来。 2、语音合成: (1)提供对用户想输入的两段文字的编辑功能。 (2)可以将用户输入的两段文字合成为一段文字并将文字转换为音频信息。 (3)可以存取转换后的音频,也可以存取任意一段文字所转换的音频。 (4)可以将存取的音频播放出来 3、语音识别: (1)提供对于用户输入的音频进行录制。 (2)可以将用户录入的音频存储到指定路径中并进行播放。 (3)将存储的音频识别成文字的方式进行输出。以下为系统使用说明 主界面 当用户进入主界面时,题目为噪声抑制实验与语音合成系统,主界面标题为语音识别系统,我们的功能主要围绕语音合成和降噪而展开,主界面有
深度学习基于全卷积神经网络的语音识别系统源代码。 本项目使用基于卷积神经网络实现。 通过下载复制以后,需要将datalist目录下的文件全部拷贝到dataset目录下,也就是将其跟数据集放在一起。 $ cp -rf datalist/* dataset/ 目前可用的模型有24、25和251 本项目开始训练请执行: $ python3 train_mspeech.py 本项目开始测试请执行: $ python3 test_mspeech.py iters_num (这里的iters_num为迭代的step数,可以在生成的step_dfcnn.txt文件里查看) 测试之前,请确保代码中填写的模型文件路径存在。 ASRT API服务器启动请执行: $ python3 asrserver.py Model 模型 Speech Model 语音模型 CNN + LSTM/GRU + CTC Language Model 语言模型 基于概率图的最大熵隐马尔可夫模型 About Accuracy 关于准确率
Python基于深度学习的中文语音识别系统源码.zip
2022-05-25 15:09:01 5.82MB python 源码软件 深度学习 语音识别
基于深度学习的噪声抑制与语音识别系统功能如下 1、噪声抑制: (1)提供对音频进行转换成频谱图,让用户分析起来更加直观。 (2)可以进行录音,并将录进的音频内容保存到指定的文件夹中。 (3)同时可以对录进的音频进行添加噪音,添加研究内容。 (4)可以对录制的音频进行降噪处理,使录进的音频听起来更加清晰。 (5)可以将处理后的音频播放出来。 2、语音合成: (1)提供对用户想输入的两段文字的编辑功能。 (2)可以将用户输入的两段文字合成为一段文字并将文字转换为音频信息。 (3)可以存取转换后的音频,也可以存取任意一段文字所转换的音频。 (4)可以将存取的音频播放出来 3、语音识别: (1)提供对于用户输入的音频进行录制。 (2)可以将用户录入的音频存储到指定路径中并进行播放。 (3)将存储的音频识别成文字的方式进行输出。 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音识别 基于深度学习的噪声抑制与语音
2022-05-04 12:06:25 17.82MB 源码软件 深度学习 语音识别 人工智能
OpenASR的 基于pytorch的end2end语音识别系统。 主要体系结构是 。 特征 最小依赖。 该系统不依赖外部软件进行特征提取或解码。 用户只需安装PyTorch深度学习框架。 良好的表现。 该系统包括高级算法,例如标签平滑,SpecAug,LST,并在ASHELL1上实现了良好的性能。 AISHELL1测试的基准CER为6.6,优于ESPNet。 模块化设计。 我们将系统分为几个模块,例如培训师,指标,进度表,模型。 扩展和添加功能很容易。 End2End 。 特征提取和标记化是在线的。 系统直接处理波形文件。 因此,该过程大大简化了。 相依性 python> = 3.6 火炬> = 1.1 pyyaml> = 5.1 tensorflow和tensorboardX进行可视化。 (如果不需要可视化结果,可以在src / utils.py中将TENSORBOARD_
2022-03-08 11:24:36 2.24MB speech transformer speech-recognition las
1
语音_识别_系统 简单的 MFCC + HMM 语音识别系统。 还没有完成。
2021-12-13 12:33:10 1.69MB C++
1
FPGA语音识别:使用VHDL和MATLAB的实验性语音识别系统
2021-12-12 10:31:17 41KB fpga distance matlab vhdl
1
ASRT:基于深度学习的中文语音识别系统 ASRT是一个基于深度学习的中文语音识别系统,如果您觉得喜欢,请点一个“ Star”吧〜 自述语言|中文版| | |||| 如果程序运行期间或使用中有什么问题,可以及时在issue中提出来,我将尽快进行响应。本项目作者交流QQ群: 894112051 提问前请仔细查看,以及避免重复提问 以下问题AI柠檬博主和群友可能会拒绝回答,包括但不限于: 询问已经写在ASRT语音识别项目文档和问题上解决过的已知重复问题。 找不到重点,不知所云的问题,但不声明任何其他信息。 跟ASRT项目没有直接相关的问题 “伸手党”类的问题 请注意,开发者并没有义务回复您的问
2021-12-01 10:00:16 6.5MB python tensorflow keras cnn
1
语音识别系统 用于语音开发技术 Title=机器人语音控制系统 ;the message sent to "Demo Window" application will be WM_USER+1000+# Message=1 CMDs=零,一,二,三,四,五,六,七,八,九,执行,各关节归零,大臂正转,大臂反转,小臂正转,小臂反转,手腕正转,手腕反转,手爪张开,手爪闭合,上升,下降,大臂运行,大臂负运行,小臂运行,小臂负运行,手腕运行,手腕负运行,手爪运行,手爪负运行,升降运行,升降负运行,大臂归零,小臂归零,手腕归零,手爪归零,升降归零,速度加,原点记忆,系统复位,示教盒,暂停,急停,回原点,速度减,区号加,区号减,单步再现,周期再现,连续再现,返回,继续,数据记忆,读取数据,设置串口,打开串口,关闭串口,
2021-10-21 17:57:54 103KB 语音识别系统 源码
1
基于全卷积神经网络的中文语音识别系统 基于全卷积神经网络的中文语音识别系统 简介简介 通过git克隆仓库以后,需要将数据列表目录下的文件全部复制到数据集目录下,也就是将其跟数据集放在一起。 $ cp -rf datalist/ * dataset/ 目前可用的模型有24、25和251 本项目开始训练请执行: $ python3 train_mspeech.py 本项目开始测试请执行: $ python3 test_mspeech.py iters_num (这里的iters_num为迭代的step数,可以在生成的step_dfcnn.txt文件里查看) 测试之前,请确保代码中填写的模型文件路径存在。 ASRT API服务器启动请执行: $ python3 asrserver.py 模型模型 语音模型语音模型 CNN + LSTM / GRU + CTC 语言模型 基于概率图的最大
2021-09-12 09:43:47 36.73MB 系统开源
1