SEGAN:语音增强生成对抗网络 介绍 这是SEGAN项目的存储库。 我们的原始文件可以在找到,并且测试样本可以。 在这项工作中,采用了一种对抗性生成方法,以一种完全卷积的体系结构来进行语音增强(即从损坏的语音信号中去除噪声),如下所示: 该模型处理处于不同SNR的许多噪声条件下的原始语音波形(训练时为40,测试时为20)。 它还可以对来自混合在同一结构中的许多说话者的语音特征进行建模(无需任何身份监督),这使得生成的结构在噪声和说话者维度上具有普遍性。 所有项目都是使用TensorFlow开发的。 关于GAN的定义和部署,有两个很好的参考资料库: GAN:实施改进以更稳定的方式训练G
1
noizeus数据库,这个语音库有纯净的语音和不同信噪比的带噪语音,但是没有纯噪声。
2021-08-16 22:18:25 31.81MB noizeus  噪声库 语音增强
1
行业分类-政务-智能会议环境下语音增强技术及DSP系统设计.rar
2021-08-13 14:02:18 14.45MB 行业分类-政务-智能会议环境下语
最原始的SEGAN论文
2021-08-12 14:12:47 326KB GAN 生成对抗网络 语音增强 pytorch
1
包括用于单通道语音增强的相位谱补偿 (PSC) [1] 方法的基本实现,以及说明其用法的演示。 参考: [1] AP Stark、KK Wojcicki、JG Lyons 和 KK Paliwal,“用于语音增强的噪声驱动短时相位频谱补偿程序”,Proc。 INTERSPEECH 2008,澳大利亚布里斯班,第 549-552 页,2008 年 9 月。 [2] KK Wojcicki、M. Milacic、A. Stark、JG Lyons 和 KK Paliwal,“利用短时傅立叶频谱的共轭对称性进行语音增强”,IEEE 信号处理快报,卷。 15,第 461-464 页,2008 年。
2021-08-03 16:39:56 1.55MB matlab
1
这组代码是“Islam, MT, Shahnaz, C., Zhu, WP and Ahmad, MO, 2018. Enhancement of Noisy Speech with Low Speech Distortion based on Probabilistic Geometric Spectral Subtraction.arXiv preprint arXiv:1802.05125”的实现。 如果您使用代码,请引用论文。 手稿的 PDF 可在 ARXIV 或http://www.mdtauhidul.com/pub.html免费获得。
2021-07-19 10:09:24 54KB matlab
1
语音增强算法的FPGA实现.pdf
2021-07-13 19:04:04 304KB FPGA 硬件技术 硬件开发 参考文献
使用AutoEncoder实现语音增强.pptx,15页PPT内容;使用AutoEncoder实现语音增强.pptx
2021-07-07 21:51:55 3.32MB 语音
1
使用16000采样 新写了音频混淆代码 ,加了readme最后代码
2021-06-03 18:09:55 12.59MB 语音增强语音分离