La余弦压缩代码matlab
多媒体系统2020-2021
先进的音频编码器
该工作旨在实现高级音频编码(AAC)编码器/解码器。
许多国际标准(例如MPEG-2,MPEG-4,H.264等)都使用AAC的变体。本文中介绍的版本更像3GPP
TS
26.403规范,其中缺少一些处理步骤。
心理声学模型是一个例外,它是MPEG
AAC的略微简化版本。
尽管进行了简化,但此版本仍能带来很好的效果。
AAC编码和解码属于波形压缩类别,并尝试以一种方式表示原始信号,以使其解码版本听起来与原始信号尽可能相似。
心理声学模型用作保真度标准,它允许引入低于可听度阈值的信号失真(由于量化而产生的噪声)。
因此,指导量化器机制的心理声学模型机制起着主导作用。
为了减少多余的信息,AAC基本上使用在Filterbank阶段使用所谓的修正离散余弦变换(MDCT)实现的变换编码方法,而对于熵编码,则使用在同义阶段实现的霍夫曼编码。
更具体地说,在编码过程中,原始音频信号(对于我们来说,采样48000个样本/秒的立体声)被分成2048个样本的50%重叠部分(帧)。
然后,每个帧被自主编码,因此最终编码的比特流由
2022-06-24 18:22:45
8.15MB
系统开源
1