语音质量评价matlab代码深度转换 深度卷积神经网络用于音乐源分离 该存储库包含用于数据生成,预处理和特征计算的类,可用于训练具有不适合内存的大型数据集的神经网络。 此外,您可以从中找到用于查询乐器声音样本的类。 在“示例”文件夹中,您可以找到上述类的使用案例,以了解音乐源分离的情况。 我们提供用于特征计算(STFT)和用于训练卷积神经网络以进行音乐源分离的代码:使用数据集iKala数据集唱歌语音源分离,使用DSD100数据集进行语音,低音,鼓分离,用于大鼓,单簧管,萨克斯风和小提琴的编码。 当原始分数可用时,后面的例子是使用RWC乐器声音数据库中的乐器样本训练神经网络的好例子。 在“评估”文件夹中,您可以找到基于Matlab的代码来评估分离质量。 为了训练神经网络,我们使用和。 我们使用已经训练有素的模型来完成不同任务,提供分离代码。 在examples / dsd100 / separate_dsd.py中将音乐分离为人声,贝斯,鼓和伴奏: python separate_dsd.py -i -o -m <path_to_model
2023-04-12 18:06:06 211KB 系统开源
1
本转语音,一般会用在无障碍开发。下面介绍如何使用Python实现将文本文件转换成语音输出。跟着小编一起来看看吧。
2023-04-12 15:27:29 78KB python 文字转语音 python 文字转换语音
1
MATLAB口罩穿戴检测系统(未戴预警,语音播报,GUI界面,多过程图)仿真
2023-04-10 17:51:12 970KB 口罩穿戴检测 口罩识别
1
android高仿微信聊天界面,语音,表情,拍照及本地图片选择功能
2023-04-10 14:39:48 29.16MB 聊天拍照表情
1
CASR-DEMO(中文自动语音识别演示系统) 关于本项目的一些说明 首先,欢迎大家关注项目,进行学习研究。收到一些小伙伴的问题我就集中回答下,这里是demo的源码,有两个版本其一是称为speech_env,这是一个简单的语音识别功能,界面如下面的效果图一;还有一个是V2.0的目录,这个版本功能比较齐全,界面如效果图二。有一点项目只在win10平台上测试过,其他不保证能不能运行。由于月久失更,有些依赖包可能需要修改,不过应该都是小问题,根据实际过程的报错信息修复就行。再次感谢大家的关注! 最新整理了两个版本的发布版 speech_env(效果图一) speechV2.0基于第三方接口实现语音识别和语音合成,说话人识别功能(效果图二) 微信:LHH754086474 于2019年12月25日更新。
2023-04-09 19:54:11 116.98MB 系统开源
1
制作的是一个机器人,能够识别任意人的说话语音,而且能够自己修改识别的语音而进行二次开发。
2023-04-09 14:40:17 287KB 非特定人语音识别
1
凌阳 语音小车 程序,可以简单实现声控小车的前进,转弯,后退以及停止
2023-04-09 14:01:27 229KB 凌阳 语音小车 程序
1
1分钟搞定配音,免费短视频配音,文字转语音语音合成,自媒体、软件集成都可以用!
2023-04-09 02:17:34 1.93MB 语音识别
1
基于STM32智能窗帘系统 主控stm32F103C8T6 模块:时钟模块、bh1750光照强度传感器、dht11温湿度传感器、语音识别模块、蓝牙/wifi、42步进电机、电机驱动板、led灯、按键、0.96寸128✘64oled显示模块。 版本2.0 1、自动模式 ①根据光照强度等级度,窗帘线性开合。 ②定时时钟,定时开关窗帘。 ③智能语音控制窗帘闭合,可随意控制窗帘开个度。 ④环境信息bh1750光照传感器,dht11温湿度传感器,窗帘开关状态显示在oled显示屏。 ⑤关窗开led灯,开窗关灯 2、手动模式 ①蓝牙/wifi控制窗帘开关 ②智能语音控制窗帘,可随意控制窗帘开个度。 ③环境信息bh1750光照传感器,dht11温湿度传感器,窗帘开关状态显示在oled显示屏。 ④按键控制光照阈值。 3、非法闯入报警模式 ①检测到有人从窗帘外面进入,蜂鸣器报警 ②语音控制窗帘闭合,可随意控制窗帘开个度。 ③环境信息bh1750光照传感器,dht11温湿度传感器,窗帘开关状态显示在oled显示屏。 !!!可根据要求定制。 资料含开发源码,模块原理图,PCB文件
2023-04-08 18:18:29 51.66MB stm32 智能窗帘 语音识别 蓝牙
1
百度语音合成的net代码,实现可以大于500字以上的语音合成,1000字生成的语音文件大小500K
2023-04-07 18:17:26 427KB net 语音合成
1