MP3编解码原理
MP3是MPEG-1 Atdio Layer-3的缩写,它是一套完整的基于感知的音频编码算法。这一算法应用了心理声学模型可达到1:12的压缩比率。心理声模型应用于人耳特性,最大限度保持原始声音质量。MPEG-1 Audio编码对象是20 Hz~20 000 Hz的宽带声音,采用感知子带编码,也叫做子带编码(sub-band coding,SBC),从而达到既压缩声音数据又尽可能保持声音原有质量的目的。SBC编码对象不局限于话音数据和某一种声源。具体思想是:首先把时域中的声音数据变换到频域,对频域内的子带分量分别量化和编码,根据心理声学模型确定样本精度,从而达到压缩数据量的目的。子带编码的理论根据是听觉系统的掩蔽特性,主要是利用频域掩蔽特性,编码过程中保留信号带宽,但是却扔掉被掩蔽的信号,因此编码后还原(解码、重构)的声音信号与编码前的声音信号不相同,但人的听觉系统很难分辨出它们的差别。因此,对于听觉系统,这种压缩是"无损压缩"。
当打开MP3文件后,播放器首先试图对帧进行同步,然后分别读取通道息及增益因子等数据,再进行霍夫曼解码,至此已获得解压数据。但这些数据不能播放,它们仍处于频域,若要播放,还需将其通过特定手段由频域变换到时域。然后再分别进行立体化处珲、抗锯齿处理、IMDCT变换、IDCT变换及窗口化滑动处理。这样得到的数据就可进行D/A转换并播放。
MP3歌曲的解码是一个非常复杂的过程,可通过Start_mp3_decode()解码函数完成。另外,还需给解码函数进行供给数据、针对音频接口的初始化、针对播放过程的初始化等操作。
2022-05-29 01:54:00
6KB
设计方法
1