使用Matlab把自己(男)的声音分别变成小孩的声音、女人的声音和老人的声音。
2023-04-22 18:48:03 135KB Matlab 语音 信号处理
1
ISD4004的录放音原理,以及使用方法。
2023-04-21 20:12:05 59KB ISD4004
1
lpc matlab代码 用于多通道卷积语音/音乐分离的语音密度估计。 我使用独立向量分析(IVA)作为分离框架。 请检查报告以获取详细信息。 请使用来重现报告的结果。 我重写了代码以使其更有条理和有用。 与流行的端到端监督语音分离方法不同,此处的目标是学习用于无监督分离的神经网络密度模型。 所得的密度模型可用于例如在线或批量分离,不同数量来源的分离,人工或实际混合物的分离,而无需重新训练任何不同的特定监督分离模型。 关于Pytorch培训代码 Artificial_mixture_generator.py:实际混合矩阵为inv(a_FIR_system)*(another_FIR_system),因为我们不断更改混合矩阵,并且自然梯度下降对组合的分离混合矩阵起作用。 dnn_source_priors.py:定义了简单的圆形和非圆形源模型。 如果还想恢复每个仓的相位,则必须使用非圆形模型。 恢复相位(直到某些全局旋转歧义)是不平凡的,因为这将使语音反卷积/去杂音化。 这是通过迫使使用估计相位的重构语音也与原始源保持一致来实现的。 尽管如此,轻量级的无记忆圆形模型在大多数情况下似乎已经
2023-04-21 19:42:53 593KB 系统开源
1
本设计为基于MATLAB的HMM语音信号识别,可以识别0-9十个阿拉伯数字,带有一个丰富的人机交互GUI界面。算法流程为:显示原始波形图……显示语音结束处放大波形图……显示短时能量……设置门限……开始端点检测……,也可以通过添加噪声,对比加噪后的识别准确率。后续可二次开发,做成九宫格形式,做一个电话拨号音识别。
1
资源包含文件:设计报告word+源码及数据 该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括 CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含 transformer、CBHG,数据集包含 stc、primewords、Aishell、thchs30 四个数据集。 声学模型采用 CTC 进行建模,采用 CNN-CTC、GRU-CTC、FSMN 等模型 model_speech,采用 keras 作为编写框架。 详细介绍参考:https://biyezuopin.blog.csdn.net/article/details/122512802?spm=1001.2014.3001.5502
mixly语音识别库文件加固件.rar
2023-04-20 11:16:10 2.63MB ardunio
1
通过语音分析和人声指数变化检测压力 技术资料 使用的语言 Python 集成开发环境 皮查姆 硬件 Raspberry Pi-4B型-4 GiB USB麦克风-最大采样频率能力为48 kHz 代码库的目录结构 主干-包含代表从数据分析到模型训练的所有内容的研究代码 bone_independent-基于Windows的实时语音压力预测和上载文件语音压力预测,独立于“骨干”中的培训包。 speech_analysis_raspi-树莓派优化的语音压力分析组件这是一个完整的工作代码,只需复制此文件夹并在安装了所需python软件包的虚拟环境中运行其中一个预测脚本,就足以使此广告开始运行。 在此文件夹中找到“ requirements.txt”文件,用于树莓派的生产python环境,该环境与语音压力预测相关。 精确的无创应力检测组合方法 这只是为实时和连续可靠的动态无创人类压力检测而联合开发
2023-04-19 16:54:08 382KB Python
1
UE5免费的语音识别解决方案,后期免费使用。 文章介绍: https://blog.csdn.net/Highning0007/article/details/125348385
2023-04-19 14:05:28 101B UE5 语音识别
LD3320加STM32F103C8T6智能灯控,PWM调光,语音识别。
2023-04-19 09:43:36 5.16MB stm32 语音识别 ld3320
1
用c#编写的基于百度的语音识别小项目,可以把本地的音频文件转化为文字,没有录音功能和实时在线转化功能
2023-04-18 16:02:03 343KB C#
1