人工智能-基于BP神经网络的语音增强算法研究.pdf
2022-06-25 19:09:12 922KB 人工智能-基于BP神经网络的语音
第三章经典的多通道语音增强方法 语音增强方法作为前置处理方案是抑制干扰的一种非常有效的途径,多年来, 随着人们对语音增强研究的深入,人们越来越意识到通常情况下噪声是随机出现 的,且品种多样,随着场合的不同而不同。要想实现理想的增强效果是不太可能 的,鉴于实际应用中的种种情况,人们坚持不懈的做出了很多的探索,总结出适 应不同情况的多种增强方法。大体上来说,语音增强算法可从信号输入的通道数 上分为单通道的语音增强算法和多通道的语音增强算法。下面就主要阐述经典的 多通道语音增强算法140]。 3.1固定波束形成方法 波束形成是阵列处理中常用的方法,固定波束形成和自适应波束形成是其中 基本的两类。本节着重研究固定波束形成方法。 波束形成,就是通过空间信号进行滤波,加强了特定方向上的目标信号而削 弱其他方向的干扰信号,类似于构造一个波束,因而形象地称之为波束形成。它 是阵列信号处理中最重要的内容。波束形成过程是使用电子线路加权跟踪信号, 而并非通过物理结构改变进行定向接收,可见波束形成方法实质上是一种多输入 单输出的多维空间滤波系统。在麦克风阵列系统可以利用波束形成的这种特性, 加强目标声源方向的语音信号,抑制其他方向上的噪声干扰。 波束形成方法,按是否和依赖输入数据可分为固定波束形成和自适应波束形 成两大类。通常提及的波束形成方法属于前者,它是闭环系统,其最优设计依赖 于接收信号的随机统计特性。为了更有效的消除其他方向干扰,需要预先知道所 有信号和干扰声源的方位,这涉及到多元定位或到达波方向的估计问题。而非依 赖数据波束形成方法则是一个开环系统,类似与一般的白适应滤波器。波束形成 的方法还可以分为基于信号到达方向和基于用户传输训练序列的波束形成。然而 以上方法在实际应用中还存在缺点和不足,近年来人们提出了许多盲波束形成的 方法,这些方法不需要阵列和信号的先验知识。 通常情况下,波束形成方法借助于从传感器阵列采集来的信号,形成一个加 权组合来产生输出,即 y(n)=W爿x(,z),m=O,...,M-1 (3一1) 其中,波束形成的加权矢量为W=[WoⅥ⋯~一l】。。
2022-06-22 22:45:21 2.37MB 延迟-求和 麦克风阵列 语音增强
1
用于语音增强的基于 MMSE 的噪声 PSD 跟踪算法的 Matlab 实现。 该软件包是在“低复杂度的 MMSE 噪声 PSD 跟踪”中描述的算法的实现,作者是 Richard C. Hendriks、Richard Heusdens 和 Jesper Jensen,IEEE 国际声学、语音和信号处理会议,03/2010,达拉斯,德克萨斯州,第 4266-4269 页,(2010 年)。 该算法复杂度较低,但能够准确估计跟踪延迟较低的非平稳噪声的噪声PSD。
2022-06-15 11:41:18 667KB matlab
1
语音增强技术是音频信号处理中的重要部分,频谱减法是目前在语音增强技术中最常用的方法之一。针对传统频谱减法会产生音乐噪声并无法消除音乐噪声的不足之处及高频噪声干扰比较严重的情况下频谱减法效果差的情况,采用了在频谱减法之后进行LMS滤波以降低音乐噪声对语音质量的影响和低通滤波以滤除脉冲干扰。根据仿真结果表明,改进扩展频谱减法能够有效降低音乐噪声和尖锐的高频兹兹声,从而提高信噪比,达到语音增强的目的。
2022-06-10 14:13:58 503KB 语音增强 频谱减法 低通滤波
1
基于matlab的 谱减法语音去噪的算法研究 与实现
2022-06-10 14:02:09 278KB 谱减法 语音去噪 语音增强 算法
1
音频处理器 用于语音增强的 Java 库 用法 java降噪示例 [wavfile] Denoiser denoiser = new Denoiser(parameters...); float[][] 输入 = ...; 浮动[][]输出=降噪器。过程(输入); Denoiser denoiser = new Denoiser(parameters...); 浮动[]输入= ...; 浮动 [] 输出 = 降噪器.过程(输入); 参考 [1] 语音增强的前向后向决策导向方法 Richard C. Hendriks、Richard Heusdens 和 Jesper Jensen [2] 以法莲,Y.; Malah, D.,“使用最小均方误差短时频谱幅度估计器的语音增强”,声学、语音和信号处理,IEEE 交易,第 32 卷,第 6 期,第 1109,1121 页,1984 年 12 月
2022-06-09 17:29:49 5.84MB Java
1
基于谱减法的语音增强技术研究.doc
2022-05-31 17:00:20 319KB 互联网
中英翻译《使用加权滤波器的一种改进的谱减语音增强算法》.doc
2022-05-25 19:06:23 4.22MB 文档资料
TSTNN 这是PyTorch实施的论文“ TSTNN:基于两级变压器的时域语音增强神经网络”,该方法已被ICASSP 2021接受。更多细节将在稍后显示!
2022-05-24 21:45:12 24KB Python
1
图5.1延迟一求和波束形成图 延迟.求和公式表示为⋯ Xm(t)=s(t一%(矽))+rim(t) (5—1) y(,)=∑%‰o一%(≯)) (5—2) m=l %(≯):%一—(m-1)d—eos矽(5-3) C 其中矽表示阵列指向,d表示相邻麦克之间的距离,c表示声速,口=【口1,a2,⋯,aMlr 是对M路语音信号所加的权值,也称之为波束控制因子,%’(≯)是声源到第m个麦 克风的实际时延,%(≯)是对第m个麦克风接收到的语音信号的时延补偿。nm(t)是 第m路语音信号中混入的噪声。 为了保证系统的因果性,还需要对所有的麦克风延迟附加一个固定延迟%, 该固定延迟要大于或等于声波传过整个阵列长度所需时间的一半,即: fo≥掣一d (5-4) 5.2基于有/无语音概率检测的LSA—MMSE方法 基于高斯分布模型的MMSE估计法,可以有效降低“音乐噪声”[.71,但其对语 音谱的估计是在假定语音出现的条件之下,对带噪语音每一频点进行加权处理, 得到语音谱的估计值。实际语音段中,有的帧是带噪语音,有的帧只含噪声, 且 经过FFT变换后的带噪语音谱中并不是每一频点都含有语音,有的频点只含有噪 声。可以利用“软判决”思想,将有/无语音的概率【521(后面将会具体阐述)考虑进 去,具体流程如图5.2所示。 下面就经过延迟.求和波束形成的语音进行处理,具体算法如下阐述。
2022-05-23 15:11:20 2.37MB 延迟-求和 麦克风阵列 语音增强
1