第四章 视频编码标准
4.2 H.261标准
4.2.1图像格式
H.261采用一种公共中间格式(CIF),不论何种彩色格式,发送方先把自己国家的彩电制式转换成CIF格式,经H.261编码后再由CIF格式转换到接收方彩电制式。
CIF及QCIF的视频信号结构采用四级结构:图像、块组(GOB)、宏块、块。
4.2.2 H.261编解码器
1、H.261编解码器系统
2、视频信源编码器
(1)帧间编码和帧内编码自动判决准则
根据帧间相关性判定来确定采用帧间编码还是帧内编码,相关性表达式为:
VAR越小相关性越大,当VAR<=64时,采用帧间模式,当然当VAR>64且过去帧的方差大时(时也可采用帧间模式。
(2)帧间编码与运动估计
DCT变换、量化后传送到复合编码器。
(3)帧内编码
(4)环路滤波器
FIR低通滤波器,去除不需要的高频成分。
3、视频复合编码器
视频复合编码器对量化后的视频数据进行变长编码,比插入一些辅助数据(帧首、块组首等),得到复合视频图像数据结构。
4、传输缓冲器
使输出码率基本稳定
5、传输编码器
4.3 H.263标准
4.3.2 H.263视频信源编码算法
主要技术:
(1)运动矢量
(2)半像素预测
(3)二维预测
(4)非限制的运动矢量模式
(5)基于句法的算术编码
(6)高级预测模式
(7)PB帧模式
4.4 MPEG-1标准
主要功能:
(1)视频压缩编码,编码前必须将视频转换成逐行扫描图像
(2)录像机正放、冻结、快进、快退和慢放功能以及随机存储功能。
、MPEG-1的图像类型
定义了三种图像类型:I、P、B图像。I采用帧内编码的图像,P(预测图像):采用帧间编码,参考前一幅I或P图像,用作运动估计。B(双向预测图像)。
双向预测变编码可以解决“暴露”问题,即某一物体在前一帧为显示出来,但在后一帧却先“暴露”出来,双向预测能更准确地找出运动矢量。
2、MPEG-1编码结构
MPEG-1多出片层,用于防止误码在一帧内扩散。
4.5 MPEG-2标准
标准包括系统、视频、音频及符合性4个文件。
4.5.1 MPEG-2编码复用系统
码流分为三层:基本比特流(ES),分组基本码流(PES),复用后的传送码流(TS),节目码流(PS)。
4.5.3 MPEG-2视频编码器
码流采用图像序列(RS)、图像组(GOP)、图像(P)、片(Slice),宏块(MB)、块(B)。
3、基于帧或场的DCT编码
DCT编码适用于相对静止或慢运动的景物,这是因为这时帧与帧之间对应相邻行之间的空间相关性较大。
对于运动快的物体由于采集到的图像中帧与帧的空间相关性弱,因此不适宜用帧间编码,故采用帧内编码。
4.6 MPEG-4标准
主要特点:
(1)对于不同的对象可采用不同的编码算法,从而进一步提高压缩效率
(2)对像各自独立,提高多媒体数据可重用性
(3)允许用户对单个对象操作
(4)允许在不同的对象之间灵活分配码率
(5)方便地集成自然音频视频对象和合成音视频对象
4.6.2 基于VOP的视频编码
从轮廓、纹理的思路出发,支持基于视觉内容的交互,同时创新地提出了基于视频对象(VO)的思想,引入视频对象平面的概念,将每一帧图像看成由不同的VOP组成。
可以以传统的标准矩形帧表示,也可以是场景中某一物体或某一层面,即从图像中分割出来的不同物体,每个VO有:运动信息、形状信息、纹理信息表示。
2、VOP的编码技术
1)形状编码
编码的形状信息有两类:二值形状信息和灰度形状信息。
(2)运动估计和运动补偿
MPEG-4采用了“重叠运动补偿”。为了适应任意形状的VOP,还引入了图像填充(image Padding)技术和多边形匹配技术。
(3)纹理编码
DCT方法。
(4)分级扩展编码
每一种分级编码至少都有两个VOL:基本层和增强层;
4.7 JPEG标准(静止图像压缩编码标准)
4.8 JPEG2000标准
JPEG2000,支持更多的颜色分量和更大的颜色深度。
4.8.2 JPEG2000核心编解码器
1、预处理
DC电平平移(使无符号样本值的动态范围基本关于零对称,在离散小波变换后系数动态范围不大,有利于后续编码)、分量间变换(去除分量间的相关性)。
2、小波变换
离散小波变换是对每个分片的每个分量进行的。
3、量化
JPEG2000采用了标量量化。
4、编码算法
JPEG2000编码器采用了EBCOT算法。
4.9 AVS标准
标准进展情况
此编码技术主要解决数字音视频海量数据的编码压缩问题,也称数字视音频编解码技术。
视频编码及关键技术
视频与MPEG标准都采用混合编码框架,包括变换、量化、熵编码、帧内编码、帧间编码、环路滤波等技术模块。
AVS视频编码的核心技术:8x8整数变换、量化、帧内预测、1/4精度像素差值、特殊的帧间预测运动补偿、二维熵编码、环路滤波等。
一般来讲,2~3个参考帧基本能达到最高性能,因此AVS视频标准限定最多采用两个参考帧,在没有增大缓冲区的前提下提高P帧的编码效率。
AVS标准还提出对称模式,即只编码一个前向矢量,后向矢量由前向矢量导出,从而实现双向预测。
同时AVS熵编码基于上下文的自适应变长编码技术。