从预先画面中并非能估算出在一幅图像中所有信息。例如在某一背景中门是开着的,则无法从前一帧关着门的画面中来估算出门后面的详情,所以在P帧中的宏块不能从运动补偿中有效地表示
这类问题的信息。在MPEG中增加了B帧,它的编码既考虑了预先帧又涉及到未来帧,也就是说B帧中的宏块可能有四种编码:
●帧内编码:不采用运动补偿。
●前向预测编码:用预先帧作为基准帧。
●后向预测编码:用下一幅画面作为基础帧。
●双向预测编码:使用二种基准图像,前一帧和后一帧。
在块匹配法中衡量最佳匹配的准则有多种,其中平均绝对帧差MAD,其运算量最小,也便于硬件实现,所以应用较广。实施块匹配先要进行搜索,再进行MAD计算,从而寻求最佳匹配像块,而搜索方法也有多种,如分级搜索、全搜索、还有几种快速搜索的方法如正交搜索、共轭方向法、三步法等,总之为了降低必须传送的运动矢量信息和减少运算量以及提高预测精度。在MPEG中只对亮度信息进行运动估算和补偿,而色度信号引用同一宏块中亮度信号的运动矢量。
美国的ATSC制高清晰度数字电视采用全搜索块匹配算法,鉴于它采用宽屏显示,所以宏块用超块来替代,一个超块含有4个水平的DCT块和2个垂直的DCT块(垂直),相当于32H×16V像素块,通常进行粗、细二级估算来取得高精度的运动估值。
下面介绍帧内编码。同一幅画面本身存在着相当多的空间冗余量。例如一帧人像画面,眼唇部分的线条对于面部表情十分重要。常作为视觉观察的重点,而额头等部位轮廓变化较少,灰度层次差异也不大,这样对眼唇部分用较大数据量来表示,而额头和脸部用较少数据量来估值,不同部位用不同数据量来传送,其本身就实现了数据压缩,内帧图的压缩就是在同一时刻对不同部位进行数据压缩,在MPEG变换编码算法中可分三步进行,即离散余弦变换DcT、DCT数据的量化处理,游程长编码RLF或可变字长编码离散余弦变换是一种正交变换编码方法,它把每一个像块空间分布的量映射成频率域中各系数值,根据频率成分统计的分布特征,发现频谱能量集中于低频域的特点,忽略或压缩高频分量,并对不同频率分量分配不同的位率,从而达到压缩信息的目的。具体地讲,把一个8 x 8的数据块,用一个直流分量Dc系数和63个交流分量Ac系数来表示,以亮度像块为例,直流分量对应于该块的平均亮度,而两帧图像中亮度与色差变化值转变为频率值,变化比较大的像点对应于较高的频率,变化较小的对应于较低的频率.当进行DcT的逆变换时,冉把64个DcT频率系数转变为空间值。
考虑到把这些数据串行起来,采用了z字形的扫描路径(如图3所示),由此得到按扫描先后顺序排列的原始数据,从而使二维空间转换成一维的数据,这些串行数据既是灰度等级Y,也是扫描路径的函数,当然也是色差等级cB、cR以及扫描路径的函数,从而有利于实施编码和进行DCT变换。
考虑到人眼对直流和低频分量较敏感,而对于高频分量不甚敏感的现象,不同频率设置不同的阈值和折算值,DcT数据通过这种折算,空出视觉感受大的成分,而忽略影响小的成分,这一处理过程谓之DcT的量化处理,图13展示128位数据经DCT变换量化后的情况。显然量化处理后的DCT函数只有左上角有一部分数据,而右下角部分除以量化折算值后均小于1,取整数后变成O值,从而大大减少了传输的数据量,使图像信息得到压缩。
从图14中可以看出,把DCT系数量化后出现较多的0值,降低了传输总量,但仍占用码位,为了进一步压缩数据采用了游程长编码,首先根据数据出现的概率分配不同长度的码位,频繁出现的用短码,偶然暴露的用长码,从而降低了总的传输码率,这就是游程长编码所采用的方法之一。此外,RLE不逐位传输“0”的个数代码,如0000用“0”×4表示,重放时再复原。
综上所述,内帧图编码先从整图分割处理开始,继而对每一个像块中像素进行亮度与色差量化,再把这些量化数据进行DcT变换,随后把所得数据再经过DCT量化处理,也就是依据人眼的视觉特性,对于较低空间频率的采用较低压缩率,而对于图像变化快与较复杂的部位,采用较高的压缩率。当这些数据取出时采用z型扫描的路径,从而把二维数据变成一维的字符,z型扫描路径从低频到高频,有利于数据处理,最后再进行游程长编码。
经过时域冗余编码和空域冗余编码,使得低级视频格式的每幅I画面压缩到仅有19000字节,P画面为10000字节,而B画面仅在2800~2900字节之间,若以2875字节为其平均值,则每秒传送NTSC制的30帧画面仅需175.5kbps的码率,图像信号已压缩了近120倍。
图15中给出了MPEG—l解码过程,首先对I图作游程长解码、反向量化,再进行DcT逆变换,然后利用运动补偿和两帧图问的估算差值,把P图、B图再生成原来的图像。
图像的压缩是依据人眼的视觉特性和视频数据编码来减少总的图像数据总量,在图像的压缩处理上有的恢复成原来的图像,有的接近于原图,DVD机采用前一种形式,而DVB接收机正是用后一种。人眼的视觉特性是多方面的,例如对亮度的敏感远高于色差的敏感,因此亮度要采用较高的数据率,而色差采用较低的数据率;静止物体视觉感受要高于运动物体,特别是快速变动的;还有一些属于人类主观观察的部分,例如对一幅画的主体部分与背景部分,人们更重视主体部分,这样主体采用较多的数据量,而背景则可以压缩一部分数据。数据的压缩与解压缩宛如牛奶制成奶粉,并由奶粉再重新冲泡成牛奶。DUB接收机主要进行解压缩处理,也可说成扩展过程,在这里相当于把奶粉复原成牛奶。
本文关键字:暂无联系方式无线电-电子技术知识,电子学习 - 基础知识 - 无线电-电子技术知识
上一篇:数字电视的信道编码和数字调制