1 oled显示屏 2 LD3320语言识别 3 红外测温模块 4 语音播报模块 5 步进电机驱动 6 舵机控制
2023-04-13 00:44:50 122.57MB 语音识别
1
PyTorch + Catalyst实现的“ 。 该存储库处理培训过程。 为了进行推断,请检出GUI包装器:PyQT中的 。 该储存库已与合并为。 目录 要求 计算方式 我们在1050 Mobile和Tesla V100的两个GPU上运行了该程序。 我们没有进行任何基准测试,但是V100的速度大约提高了400倍。 它还取决于您下载的数据量。 因此,任何服务器级GPU都是可行的。 贮存 该程序确实会生成很多文件(下载和其他方式)。 每个音频文件的大小为96kiB。 对于7k独特的音频剪辑,并以70/30的比例进行火车和验证拆分,它占用了约120GiB的存储空间。 因此,如果您下载更多音频片段,则至少为1TB 。 记忆 至少需要4GB VRAM 。 它可以处理2个批处理大小。在20个批处理大小下,在两个GPU上,每个GPU占用16GiB VRAM。 设置 如果您使用的是Docker,则
1
语音质量评价matlab代码深度转换 深度卷积神经网络用于音乐源分离 该存储库包含用于数据生成,预处理和特征计算的类,可用于训练具有不适合内存的大型数据集的神经网络。 此外,您可以从中找到用于查询乐器声音样本的类。 在“示例”文件夹中,您可以找到上述类的使用案例,以了解音乐源分离的情况。 我们提供用于特征计算(STFT)和用于训练卷积神经网络以进行音乐源分离的代码:使用数据集iKala数据集唱歌语音源分离,使用DSD100数据集进行语音,低音,鼓分离,用于大鼓,单簧管,萨克斯风和小提琴的编码。 当原始分数可用时,后面的例子是使用RWC乐器声音数据库中的乐器样本训练神经网络的好例子。 在“评估”文件夹中,您可以找到基于Matlab的代码来评估分离质量。 为了训练神经网络,我们使用和。 我们使用已经训练有素的模型来完成不同任务,提供分离代码。 在examples / dsd100 / separate_dsd.py中将音乐分离为人声,贝斯,鼓和伴奏: python separate_dsd.py -i -o -m <path_to_model
2023-04-12 18:06:06 211KB 系统开源
1
本转语音,一般会用在无障碍开发。下面介绍如何使用Python实现将文本文件转换成语音输出。跟着小编一起来看看吧。
2023-04-12 15:27:29 78KB python 文字转语音 python 文字转换语音
1
MATLAB口罩穿戴检测系统(未戴预警,语音播报,GUI界面,多过程图)仿真
2023-04-10 17:51:12 970KB 口罩穿戴检测 口罩识别
1
android高仿微信聊天界面,语音,表情,拍照及本地图片选择功能
2023-04-10 14:39:48 29.16MB 聊天拍照表情
1
CASR-DEMO(中文自动语音识别演示系统) 关于本项目的一些说明 首先,欢迎大家关注项目,进行学习研究。收到一些小伙伴的问题我就集中回答下,这里是demo的源码,有两个版本其一是称为speech_env,这是一个简单的语音识别功能,界面如下面的效果图一;还有一个是V2.0的目录,这个版本功能比较齐全,界面如效果图二。有一点项目只在win10平台上测试过,其他不保证能不能运行。由于月久失更,有些依赖包可能需要修改,不过应该都是小问题,根据实际过程的报错信息修复就行。再次感谢大家的关注! 最新整理了两个版本的发布版 speech_env(效果图一) speechV2.0基于第三方接口实现语音识别和语音合成,说话人识别功能(效果图二) 微信:LHH754086474 于2019年12月25日更新。
2023-04-09 19:54:11 116.98MB 系统开源
1
制作的是一个机器人,能够识别任意人的说话语音,而且能够自己修改识别的语音而进行二次开发。
2023-04-09 14:40:17 287KB 非特定人语音识别
1
凌阳 语音小车 程序,可以简单实现声控小车的前进,转弯,后退以及停止
2023-04-09 14:01:27 229KB 凌阳 语音小车 程序
1
1分钟搞定配音,免费短视频配音,文字转语音,语音合成,自媒体、软件集成都可以用!
2023-04-09 02:17:34 1.93MB 语音识别
1