您当前的位置:五五电子网电子知识电子学习基础知识无线电-电子技术知识信源编码和频带压缩 正文
信源编码和频带压缩

信源编码和频带压缩

点击数:7585 次   录入时间:03-04 11:52:37   整理:http://www.55dianzi.com   无线电-电子技术知识


作为预测再生样值来传送。


    综上简述,预测编码是使预测值尽可能接近实际像素值,也就是要找到一种接近于原信号统计特性的预测方法,利用预测误差来消除图像间相关性,从而达到压缩数据的目的。预测编码系统结构简单,有较高的频带压缩效应,进行运动补偿预测方面有一定独到之处,其编码思路在图像压缩编码中得到应用。

  2.正交变换编码

  在图像压缩编码中,正交变换编码也是一种最基本的编码方法,它将空间域(指欧几里德几何空间)所描述的图像信号变换到另一类量的正交矢量空间,如果所选取的正交矢量空间的基向量与图像本身的特征向量很接近,就很易消除图像空间的相关性,达到频带压缩的目的。首先把图像分割成许多(M×N)宏块,而每个宏块内含有xx个像素,然后对这些像素进行正交变换,形成同样尺度的变换系数块,变换前后的最大差异是,空间域的宏块中像素存在着很强的相关性,能量分布比较均匀,经过正交变换后,变换系数间是处于统计无关的。消除了相关性,能量集中在直流和低空间频率域的变换系数上,解决了空间冗余度的压缩,随后在变换域上进行滤波,再进行与视觉特性相协配的量化和统计编码,即可实现有效的压缩编码。

    人们早先利用快速福里哀变换(Fast FourierTransform)FFT进行二维图像编码,随后又出现多种变换方法如沃尔什变换,K—L变换等,但被国际标准化组织IS0和国际电工委员会IEc采用作为静止图像和活动图像编码标准的是离散余弦变换(Discrete Cosine Transform)DCF。变换编码的优势体现在:

    (1)在变换域内描述视频画面要比空间域简洁;

    (2)图像的相关性明显下降,能量集中在少数几个变换系数上,主要是直流和低的空间频率,再采用量化和可变字长编码(也称为熵编码)来有效地压缩数据;

    (3)变换编码比预测编码有更强的抗干扰能力,当DPCM要求信道误码率≤10^-6时,而变换编码只要求≤10^-4:

    (4)充分利用人眼的视觉特性,特别是空间频率特性;

    (5)DcT变换能进行快速运算,便于实时进行视频压缩。

    目前利用DCT进行视频编码时,将二维空间像素值变换成二维的空间频率系数,通常以8×8个像素组成像块作为基本变换单元,每一像素采用8位量化,鉴于亮度信号为单极性,色差信号为双极性,再考虑限幅等因素后的平移数据才进行DCT变换。编码器进行正交变换,把空间域中8×8的像素值f(x、y)变换到空间频率域频率系数值F(u、V),在空间域中,通常像素排列次序由左上角作为坐标系原点(0、0),依次由对角线方向逐渐增加,其x=O-7、y=O~7。而在频率域中也以左上角作为原点,U=O、V=0的小方块作为直流系数,u代表水平空阿频率,V代表垂直空间频率,这样右下角代表最高空间频率系数,显然左上方各系数的平方值反映了图象的低频能量,而右下方各系数的平方值代表图像的高频能量,正如图4所示。

空间频率与时间频率是不同的概念,人们已经知道任意形状的时谐函数可分解成不同频率和不同振幅的各次谐波分量,这些随时间变化的电视信号,所涉及与时间相关的变化通常用频率来计算。如果一幅画面用信号来表示,同样也可分解成各种不同频率和振幅的谐波分量,但它们不是随时间而变,面是随二维空间的位置而变化,这样空间频率可分成水平空间频率L和垂直空间频率fn。空间频率与电视信号的最高谐频间存在着一定的对应关系,对于逐行扫描而言


对于隔行扫描


    式中fk为行频、fF为帧频、fv为场频、N为每帧的扫描行数,例如525线或625线。正、负号取决于图形中形态,例如传送条纹,如果条纹从右上方向左下方倾斜,则式(4)、(5)中取正号,如果条纹从左上方向右下方倾斜,则式(4)、(5)中取负号。

    鉴于正交变换足一种线性变换,利用矩阵可方便地表示线性变换,若以f表示图像的像素矩阵,F表示变换后的变换系数矩阵,则T代表正交变换矩阵,而T’表示T的转置矩阵,利用下式可完成二维线性变换。


若以(2×2)的像素阵为例,则可展开写成


    若实施DcT变换时,则变换矩阵中的系T∞…T11等均用COS函数来表示相关的量,若通过实例计算很易看清楚,二维DCT变换是将空间的像素分布变换成空间的频率分布,其左上角为直流分量DC,以左上角为圆心,在相同半径的圆弧上的系数所代表能量基本相等,越远离圆心,能量越小,所以绝大部分的能量集中在直流分量和左上方的少数低频分量。

    经过正交变换后的信号进行区域滤波,也就是把变换像数矩阵分成几个区域,每一个区域采用一种量化等级,其等级随空间频率的增加而减少。若要更细致一些,不妨根据视觉特性,对变换系数矩阵中的每一个系数分别乘以视觉加权系数,而加权系数同样也随着空间频率的增长而逐渐减少,直流分量加权系数最高,其值为1,这样视觉加权矩阵也按8×8分布,实质上是一种粗、细量化的过程,图5中给出了变换编解码系统的示意框图。




www.55dianzi.com

     MPEG为Moving pICfares Experts Group的缩写,可译成活动图像专家组,MPEG委员会始建于1988年,它隶属于国际标准化组织IsO和国际电工委员会IEc,曾经制定静图标准JPEG和电视电话会议标准H.26l,1992年制定了MPEG—l数字信号的压缩标准(包括图像和声音),其数据率为1.416Mbps,所压缩图像的分辨率为CCIR-60l标准的1/4,即低级视频格式,对于625行/50Hz的通用中间格式cIF,其有效像素区为352×288(Y)、176×144(CR、CB),而525行/60Hz的信源输入格式sIF,其有效像素区为352×240(Y)、176×120(cR、cB),取样频率为6.75MItz(Y)或3.375MHz(cR、cB)。这种格式用作VCD视盘机,它的清晰度相当于家用录像机VHS的标准,同时也作为CD—ROM的标准,这项标准写成IsO—11172。

    在MPEG-1标准中把信号分成三部分组成,即系统流、视频流和音频流,但为了便于存储和传输合成为单一的MPEG-1流,通常把MPEG-1流分成二层,即:

    -系统层:该层含有定时信息以及需要分离音频和视频流的信息和在播放时同步音、视频的信息:

    -压缩层:含有已压缩的音频流和视频流。图6中展示了MPEG—l解码系统,首先由系统解复用器取出从MPEG流中的定时信息,并把它分别送到音频和视频解码器,同时也分离出音频和视频流加到对应解码单元,以便取出解压缩的音、视频数据流。


    在MPEG-1和MPEG-2中的视频流定义了一个数据结构体系,视频流由活动图像序列组成,而每一个视频序列含有序列头标,一至多个图组GOP和序列结束码,每个图组由一幅到多幅图像组成,而视频序列的基本编码单元是图,每幅画面含有3种矩阵即亮度矩阵Y和两个色差矩阵CB、cR,Y矩阵的行和列均为偶数,而色差矩阵CB、cR无论水平或垂直方向均为Y矩阵的一半元素。图7中表明了亮度分量和色差分量相对于x—Y座标的位置,应该注意到每四个亮度Y值,必有两个伴随亮度值的色差值cR、cB,由于它们在同一位置,所以在图中仅用一个圈来表示,在这里充分体现了人眼对亮度的敏感远大于对颜色的感受。
 



    每幅图像有一个头标,并把图像划分成若干画片,通常在垂直方向分片,NTSC制图像每帧划成15片,PAL制图像每帧切成18片。每一条画片同样有一个头标和若干个宏块组成,通常每片分割成22个宏块,它的排列从左到右,从上到下,每个宏块中的亮度部分含有16行,每行有16个像素,随后再把宏块再分成4份,作为图像的基本组成单元即像块,每一个像块含有8×8=64个像素,这样宏块中亮度部分有4个像块,还有两个色差像块cB、CR,由此可算得。PAL制的画面像素值应等于

上一页  [1] [2] [3] [4]  下一页


本文关键字:暂无联系方式无线电-电子技术知识电子学习 - 基础知识 - 无线电-电子技术知识

《信源编码和频带压缩》相关文章>>>