python声音模仿训练模型包encoder.pt,synthesizer.pt,vocoder.pt,完整插入RTVC声音克隆模型,完整资源,不在需要谷歌云端下载
2023-11-09 12:57:34 378.59MB python 训练模型
1
RealTimeVoice声音训练模型包encoder,synthesizer,vocoder.pt
2022-11-04 19:05:20 378.33MB 训练模型 encoder synthesizer vocoder
1
MocikingBird已经训练好的数据集下载 vocoder部分
2022-10-28 09:08:05 141.65MB AI 深度学习 机器学习
1
并行WaveNet声码器 概述 这是一个实验项目,建立了一个基于WaveNet的声码器,该声码器在论文的启发下将梅尔频谱图并行转换为原始波。 由于非自回归模型之一的的结构,我们能够并行生成顺序数据。 由于在最大似然估计中无法直接直接对IAF模型进行优化,从而无法找到合适的最优值,因此难以一概而论,因此,本文引入了一种替代方法,即概率密度蒸馏。 它预先训练原始的WaveNet(教师),然后通过最小化两个概率之间的KL差异来优化IAF模型(学生)以对相似的输出概率进行建模。 如果再想一想,我们可以得出结论,“自回归”损失被强加给IAF模型,IAF模型本身就是非自回归模型。 这意味着,在训练序列生成模型时,“自回归”约束仍然是关键。 为了优化模型,我只尝试了简单模型(MLE),因为我对设计替代模型的动机感到好奇。 总之,在我的案例中,在没有自回归约束的情况下优化IAF模型几乎是不可行的。
2022-07-26 15:03:03 779KB Python
1
巴特沃斯带通滤波器的matlab代码声码器 本节中的代码用于实现各种声码器,通常用于声学模拟耳蜗植入物用户通过其设备体验的声音。 该代码库最初是由Stuart Rosen制作的,后来由Bob Carlyon进行了修改,并且由于或多或少地完全以一种更现代的风格进行了重写,并添加了许多附加功能。 免责声明:本手册是在假定读者对声码器工作原理有一些了解的前提下编写的。 如果不是这种情况,请与有声码器经验的人联系,因为选择错误的参数非常容易。 知道您在做什么,并且不要以为该代码是万无一失的。 它绝对没有保修,并且仅供参考。 最后,请始终在查看最新版本。 vocode()函数应该可以处理很多情况,因此可以接收一组相当复杂的参数。 所述函数的调用方式如下: [y, fs]=vocode(x,fs,p) 。 x是(单通道,即单声道)信号。 fs是采样频率, p是具有所有参数的结构。 该函数返回y ,即x的声码版本。 本文档介绍了如何设置参数结构p 。 p有四个主要部分: analysis_filters :描述用于分析目的的过滤器组。 synthesis_filters :描述用于合成的过滤器组。
2022-04-26 11:24:36 140KB 系统开源
1
matlab提取文件要素代码声码器(2013) 本节中的代码用于实现各种声码器,通常用于声学模拟耳蜗植入物用户通过其设备体验的声音。 该代码库最初是由Stuart Rosen制作的,后来由Bob Carlyon进行了修改,并且由于或多或少地完全以一种更现代的风格进行了重写,并添加了许多附加功能。 本手册是在读者对声码器的工作原理有一定了解的前提下编写的。 vocode()函数应该可以处理很多情况,因此可以接收一组相当复杂的参数。 所述函数的调用方式如下: [y, fs]=vocode(x,fs,p) 。 x是(单通道,即单声道)信号。 fs是采样频率, p是具有所有参数的结构。 该函数返回y ,即x的声码版本。 本文档介绍了如何设置参数结构p 。 p有四个主要部分: analysis_filters :描述用于分析目的的过滤器组。 synthesis_filters :描述用于合成的过滤器组。 envelope :描述如何提取信封。 synth :描述将要使用的载体的类型,以及如何将其与信封结合使用。 这些内容均以相同的顺序记录在下面。 为了给您有关如何使用代码的概述,下面是一个完整的
2022-04-26 11:06:13 4.06MB 系统开源
1
使用matlab仿真;包含原声频和升速降速升调降调后的音频;并对比导出了不同处理声音的时域频谱图
2022-04-06 03:00:04 9.58MB matlab 音视频 phasevocoder 相位声码器
1
语音处理指定了一个由 Lawrence Rabiner 教授(罗格斯大学和加州大学圣巴巴拉分校)、Ronald Schafer 教授(斯坦福大学)、Kirty Vedula 和 Siva Yedithi(罗格斯大学)组成的团队。 此练习是一组语音处理练习之一,旨在补充LR Rabiner和RW Schafer编写的教科书“数字语音处理的理论和应用”中的教材。 这个 MATLAB 练习构建了一个 LPC 声码器,即对语音文件执行 LPC 分析和合成,从而产生对原始语音的合成语音近似。 LPC 分析使用标准自相关分析来逐帧确定 LPC 系数集以及基于帧的增益 G。独立的分析方法(倒谱基音周期检测器)对每个帧进行分类语音可以是有声语音(其周期由指定基音周期范围内的倒谱峰位置确定)或无声语音(由随机噪声帧模拟),指定为 0 个样本的帧基音周期。 独立分析为处理的 LPC 合成部分提供两态激励函数,
2022-03-20 18:59:19 3.17MB matlab
1
语音模块AMBE-1000资料, AMBE-1000+CSP1027 串行参考设计原理图
2022-02-21 19:28:35 59KB AMBE-1000 CSP1027 Vocoder
1
matlab识别耳朵代码脉动声码器 什么是脉冲声码器? 脉动声码器是一种用于对听力正常的受试者进行人工耳蜗 (CI) 听力实验的工具。 它模拟人工耳蜗中的信号处理阶段、耳蜗中的电极放置以及电刺激引起的激发空间传播,并使信号再次可听。 更具体地说,它模拟 ACE CI 编码策略(Nogueira 等人,2005 年)或 CIS CI 编码策略,然后根据位置到位置模拟 Cochlear Contour Advance 电极阵列或 MedEl Flex 24 电极的刺激位置。 Landsberger 等人的频率数据,2015 年。基本思想首先是 CI 刺激阶段,然后是可听化阶段(Bräcker 等人,2009 年)。信号的处理方式与 CI 和 CI 刺激的输出类似阶段是一个电图,然后可以将其发送到 CI 对象植入物。 在下一步中,这个心电图被听觉化,使正常听力对象能听到它。 该版本能够生成电图,已在实际 CI 科目中成功测试(Hu et al, 2018, Eichenauer et al, 2016)。 CI编码策略 目前支持以下编码策略: Nogueira 等人,2005 年描述的 AC
2022-01-16 10:34:35 694KB 系统开源
1