1.音频原始数据形式:8k16bitpcm; 2.频率范围:60HZ~3400HZ; 3.三角窗数量:15组; 4.提取filter bank特征,并观察特征分布特点; 5.求取特征三阶差分并进行离线CMVN(cepstral mean and variance normalization,CMVN
2022-06-20 09:05:22 43.95MB 语音信号处理 MFCC CMVN Filterbank