lpc matlab代码 用于多通道卷积语音/音乐分离的语音密度估计。 我使用独立向量分析(IVA)作为分离框架。 请检查报告以获取详细信息。 请使用来重现报告的结果。 我重写了代码以使其更有条理和有用。 与流行的端到端监督语音分离方法不同,此处的目标是学习用于无监督分离的神经网络密度模型。 所得的密度模型可用于例如在线或批量分离,不同数量来源的分离,人工或实际混合物的分离,而无需重新训练任何不同的特定监督分离模型。 关于Pytorch培训代码 Artificial_mixture_generator.py:实际混合矩阵为inv(a_FIR_system)*(another_FIR_system),因为我们不断更改混合矩阵,并且自然梯度下降对组合的分离混合矩阵起作用。 dnn_source_priors.py:定义了简单的圆形和非圆形源模型。 如果还想恢复每个仓的相位,则必须使用非圆形模型。 恢复相位(直到某些全局旋转歧义)是不平凡的,因为这将使语音反卷积/去杂音化。 这是通过迫使使用估计相位的重构语音也与原始源保持一致来实现的。 尽管如此,轻量级的无记忆圆形模型在大多数情况下似乎已经
2023-04-21 19:42:53 593KB 系统开源
1
本设计为基于MATLAB的HMM语音信号识别,可以识别0-9十个阿拉伯数字,带有一个丰富的人机交互GUI界面。算法流程为:显示原始波形图……显示语音结束处放大波形图……显示短时能量……设置门限……开始端点检测……,也可以通过添加噪声,对比加噪后的识别准确率。后续可二次开发,做成九宫格形式,做一个电话拨号音识别。
1
资源包含文件:设计报告word+源码及数据 该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括 CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含 transformer、CBHG,数据集包含 stc、primewords、Aishell、thchs30 四个数据集。 声学模型采用 CTC 进行建模,采用 CNN-CTC、GRU-CTC、FSMN 等模型 model_speech,采用 keras 作为编写框架。 详细介绍参考:https://biyezuopin.blog.csdn.net/article/details/122512802?spm=1001.2014.3001.5502
mixly语音识别库文件加固件.rar
2023-04-20 11:16:10 2.63MB ardunio
1
通过语音分析和人声指数变化检测压力 技术资料 使用的语言 Python 集成开发环境 皮查姆 硬件 Raspberry Pi-4B型-4 GiB USB麦克风-最大采样频率能力为48 kHz 代码库的目录结构 主干-包含代表从数据分析到模型训练的所有内容的研究代码 bone_independent-基于Windows的实时语音压力预测和上载文件语音压力预测,独立于“骨干”中的培训包。 speech_analysis_raspi-树莓派优化的语音压力分析组件这是一个完整的工作代码,只需复制此文件夹并在安装了所需python软件包的虚拟环境中运行其中一个预测脚本,就足以使此广告开始运行。 在此文件夹中找到“ requirements.txt”文件,用于树莓派的生产python环境,该环境与语音压力预测相关。 精确的无创应力检测组合方法 这只是为实时和连续可靠的动态无创人类压力检测而联合开发
2023-04-19 16:54:08 382KB Python
1
UE5免费的语音识别解决方案,后期免费使用。 文章介绍: https://blog.csdn.net/Highning0007/article/details/125348385
2023-04-19 14:05:28 101B UE5 语音识别
LD3320加STM32F103C8T6智能灯控,PWM调光,语音识别。
2023-04-19 09:43:36 5.16MB stm32 语音识别 ld3320
1
用c#编写的基于百度的语音识别小项目,可以把本地的音频文件转化为文字,没有录音功能和实时在线转化功能
2023-04-18 16:02:03 343KB C#
1
今天小编要给大家介绍一款专业好用的广告语音合成软件——AdVoice。AdVoice简单易用、发音清晰、可循环播放,还支持生成MP3与添加背景音乐,值得一提的是,软件还能是实现三女一男四个播音人。软件界面美观简洁、实用方便,可快速上手,轻轻松松完成日常广告语音合成功能,真正做到简单全面实用。是用户实现广告语音合成功能的好帮手。 AdVoice软件特点 1、功能实用,操作简单; 2、支持背景音乐合成; 3、支持循环播音; 4、支持生成mp3文件; AdVoice截图
2023-04-18 15:55:41 63.47MB 应用软件-转换翻译
1
随着信息技术以及语音识别技术的不断发展,DSP 技术逐渐广泛应用于音频处理领域。本文提出了采用的高性能的处理芯片TMS320C5416DSP,同时结合具有16~32位采样精度的芯片TLV320AIC23,语音数据FLASH存储器等,实现了移动音频录放系统、语音分析系统的方案。软件部分基于CCS环境下的C语言编程。将输入信号经AIC23采样后保存在外扩存储器中,再读入DSP,经过FIR滤波器滤除噪,最后进行离散傅立叶快速变换。通过仿真实例验证了本系统的可用性和实用性。
1