python_sound_open 《语音信号处理试验教程》(梁瑞宇等)的代码主要是Matlab实现的,现在Python比较热门,所以把这个项目大部分内容写成Python实现,大部分是手动写的。使用查看帮助文件: 参考
2022-04-12 14:01:43 11.33MB python blog matlab audio-processing
1
由于HMM是在马尔可夫链的基础上发展而来的,为了更好的理解HMM,我们先了解一下马尔可夫链的基本概念。 HMM的基本理论 HMM模型在实际应用时需要解决的三个问题 HMM在语音处理中的应用 隐含马尔科夫模型HMM(Hidden Markov Model)是一种识别算法,HMM的精髓在于:观察可测,状态隐含。 HMM是一个双内嵌式随机过程,即HMM是由两个随机过程组成,其中之一是Markov链,这是基本随机过程,它描述状态的转移,另一个随机过程描述状态和观察值之间的统计对应关系。 我们考察语音,也可以发现类似的情况。语音中当前的发音音素与下一个发音音素之间以某种概率发生转移。我们听到(观察到)的只能是发音后产生的语音波形信息,假如仅考虑语音的波形(而不是经过人的听觉分析),则很难知道该语音波形对应的音素信息是什么。
1
语音信号处理-语音合成 主要内容: 一、语音合成的历史及概述 二、语音合成方法 三、TTS系统的文本分析及韵律建模 四、文语转换系统 五、语音合成技术展望 定义:语音合成是指用人工方法生成语音的技术。 研究领域:自然语言理解、语言学、语音学、信号处理、心理学、声学等。 应用领域:盲人计算机、电话信息查询、文本校对、专家系统的有声输出、火车站飞机场 的航班信息报告等。 1939年,贝尔实验室H.Dudley制作的第一个电子合成器 1960年G.Fant教授在《Acoustic Theory of Speech Production》中系统地阐述了语言产生的理论。利用这个技术可以对语音产生模型的参数进行准确估计。 1980年,MIT教授D.Klatt 设计的串/并联混合型共振峰合成 器。它用串联通道产生元音和浊辅音,并联通道产生清辅音。 80年代末E.Moulines和F.Charpentier提出基于时域波形修改和语音合成算法,该算法较好地解决了语音拼接中的问题,推动了波形拼接语音合成和文本转换技术的发展与应用。
2022-04-06 09:38:08 312KB 语音合成 语音信号处理 TTS
1
语音信号处理与数字信号处理、心理学、语言学、模式识别、计算机科学和人工智能等相结合的交叉学科,是目前发展最为迅速的信息科学研究领域中的一个,是目前极为活跃和热门的研究领域,其研究设计一系列前况科研课题,且处于迅速发展之中,其研究成果具有重要的学术及应用价值。语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。本文通过应用MATLAB对语音信号进行处理仿真,包括短时能量分析、短时自相关分析、AMDF法提取基音周期、谱估计等。
语音信号处理-语音编码 语音信号压缩编码的原理 波形编码算法 参数编码算法 混合编码算法 现代通信中的语音信号编码方法(EVRC算法) 语音信号的数字化传输一直是通信发展的主要方向之一,语音的数字传输与模拟传输相比具有更好的效率和性能,使得语音的传输变得多样化、追求低成本变得可能、保密的要求也得到了满足。但是,如果对语音信号直接采用模/数变换技术进行编码,则传输或存储语音的数据量太大,因此为了降低传输或存储的费用,就必须对其进行压缩。
2022-04-06 02:54:17 794KB 语音编码 语音信号处理 语音识别
1
语音信号处理-语音增强 线性预测技术是语音处理中最有效的手段,但是最容易受噪声影响。 原因:若将线性预测技术看做频谱匹配过程,则在含大量噪声的语音会使频谱畸变,但是预测器就设法与畸变频谱匹配,而不是与目标语音频谱匹配。当在声码器的接收端使用与发送端相同的预测器时,则复原语音的可懂度大大降低。 语音增强是从带噪声信号中提取尽可能纯净的原始语音,是解决噪声污染的一种有效方法。 主要应用范围:降低听觉噪声识别系统的与处理和线性预测编码的与处理。这种技术对语音识别和说话人识别是十分重要,可识别装置可以在含噪环境下进行工作。 目前语音增强已发展成为语音信号数字处理的一个重要分支。
1
Matlab语音信号处理程序-f11.m 可以对语音信号的单个字,词进行频率及过零率分析 clc [filename,pathname]=uigetfile; [x,Fs]=wavread; %幅度归一化到[-1,1] x = double; x = x / max); %常数设置 FrameLen = 240; FrameInc = 80; amp1 = 10; amp2 = 2; zcr1 = 10; zcr2 = 5; maxsilence = 3;  % 6*10ms  = 30ms minlen  = 15;    % 15*10ms = 150ms status  = 0; count   = 0; silence = 0; %计算过零率 tmp1  = enframe, FrameLen, FrameInc); tmp2  = enframe  , FrameLen, FrameInc); signs = 0.02; zcr   = sum; %计算短时能量 amp = sum, FrameLen, FrameInc)), 2); %调整能量门限 amp1 = min/4); amp2 = min/8); %开始端点检测 x1 = 0; x2 = 0; x3=0; x4=0; for n=1:length    goto = 0;    switch status    case {0,1}                   % 0 = 静音, 1 = 可能开始       if amp > amp1          % 确信进入语音段          x1 = max;          status  = 2;          silence = 0;          count   = count 1;       elseif amp > amp2 | ... % 可能处于语音段              zcr > zcr2          status = 1;          count  = count 1;       else                       % 静音状态          status  = 0;          count   = 0;       end    case 2,                       % 2 = 语音段       if amp > amp2 | ...     % 保持在语音段          zcr > zcr2          count = count 1;       else                       % 语音将结束          silence = silence 1;          if silence < maxsilence % 静音还不够长,尚未结束             count  = count 1;          elseif count < minlen   % 语音长度太短,认为是噪声             status  = 0;             silence = 0;             count   = 0;          else                    % 语音结束             status  = 3;          end       end    case 3,       break;    end end    count = count-silence/2; x2 = x1 count -1; subplot plot axis -1 1]) ylabel; line; line; subplot plot; axis 0 max]) ylabel; line,max], 'Color', 'red'); line,max], 'Color', 'red'); subplot plot; axis 0 max]) ylabel; line,max], 'Color', 'red'); line,max], 'Color', 'red'); 复制代码
2022-03-30 21:15:37 2KB matlab
1
基音周期估计的各种方法,matlab代码。
2022-03-26 15:23:20 2KB 基音周期
1
矩形窗函数的波形 (a) 幅频图 (b) 相频图 矩形窗函数的频谱 § 1-4非周期信号的频谱分析 幅频谱: 相频谱:
2022-03-20 20:32:46 3.25MB 语音 信号处理 人工智能
1
循环神经网络的结构
2022-03-07 16:46:08 4.21MB 语音
1