图像变换编码是指将以空间域中像素形式描述的图像转换至变换域,以变换系数的形式加以表示。

大部分图像是平坦区域和内容变换缓慢的区域,即大部分是直流和低频,高频比较少,所以适当的变换可以使图像能量在空间域的分散分布转换为在变换域的相对集中分布,以达到去除冗余的目的,结合量化,“z”扫描和熵编码等其他编码技术,可以获得对图像信息的有效压缩。

DCT变换的基本思路是将图像分解为8×8的子块或16×16的子块,并对每一个子块进行单独的DCT变换,然后对变换结果进行量化、编码。随着子块尺寸的增加,算法的复杂度急剧上升,因此,实用中通常采用8×8的子块进行变换,但采用较大的子块可以明显减少图像分块效应。

目前DCT是构成主流缓和编码框架的一项基本技术,因为DCT变换形式与输入信号无关且存在快速实现算法,HEVC沿用了H264的整数DCT,并进行了不同尺寸变换形式推广,此外,为适应不同预测方式下残差的分布情况,HEVC还引入了DST离散正弦变换。

傅里叶变换表明,任何信号都能表示为多个不同振幅和频率的正弦波和余弦波信号的叠加,如果采用的是余弦就是余弦变换,若输入信号是离散的就是离散余弦变换。

下图给出了二维8*8DCT基图像,其中左上角小图像表示水平和垂直空间频率均为0时的基图像,在任一方向都木有灰度值的变化;其余小图像分别对应于不同水平和垂直空间频率的基图像,如基图像右下角小图像对应于最高的水平和垂直频率,这里像素灰度在水平和垂直方向发生连续变化,so,离散余弦变换可以解释为:将任一8*8像素块表示为下图的64个基图像的加权和,其权值即为对应位置的DCT系数。

DCT变换python实现 dct变换对图像的意义_复杂度

HEVC使用了4种不同尺寸的整数DCT,分别为4*4、8*8、16*16、32*32