所谓视频编码方式就是指通过特定的压缩技术,将某个视频格式的文件转换成另一种视频格式文件的方式。 目前视频流传输中最为重要的编解码标准有国际电联的H.261、H.263,运动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG 系列标准,此外在互联网上被广泛应用的还有Real-Networks的RealVideo、微软公司的WMV以及Apple公司的QuickTime 等。

  MPEG是活动图像专家组 (MovingPictureExportsGroup)的缩写,于1988年成立,是为数字视/音频制定压缩标准的专家组,目前已拥有300多名成员, 包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG组织最初得到的授权是制定用于“活动图像”编码的各种标准, 随后扩充为“及其伴随的音频”及其组合编码。后来针对不同的应用需求,解除了“用于数字存储媒体”的限制,成为现在制定“活动图像和音频编码”标准的组 织。MPEG组织制定的各个标准都有不同的目标和应用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21标准。

 

                                 

java 和 视频编码 视频编码器 视频编码器有什么用_视频编码

结构框图

 

   视频压缩技术是计算机处理视频的前提。视频信号数字化后数据带宽很高,通常在20MB/秒以上,因此计算机很难对之进行保存和处理。采用压缩技术以后通 常数据带宽右以降到1-10MB/秒,这们就可以将视频信号保存在计算机中并作相应的处理。常用的算法是由ISO制订的,即JPEG和MPEG算法。 JPEG是静态图像压缩标准,适用于连续色调彩色或灰度图像,它包括两部分:一是基于DPCM(空间线性预测)技术的无失真编码,一是基于DCT(离散余 弦变换)和哈夫曼编码的有失真算法,前者压缩比很小,主要应用的是后一种算法。在非线性编辑中最常用的是MJPEG算法,即MotionJPEG。它是将 视频信号50场/秒(PAL制式)变为25帧/秒,然后按照25帧/秒的速度使用JPEG算法对每一帧压缩。通常压缩倍数在3.5-5倍时可以达到 Betacam的图像质量。MPEG算法是适用于动态视频的压缩算法,它除了对单幅图像进行编码外还利用图像序列中的相关原则,将冗余去掉,这样可以大大 提高视频的压缩比。前MPEG-I用于VCD节目中,MPEG-II用于VOD、DVD节目中。

  音频视频编码及文件格式(容器)是一个很庞大的知识领域,完整的说清楚,那就需要些写成一本教材了。这里先就几个简单的概念问题作以介绍:

  首先要分清楚媒体文件和编码的区别:文件是既包括视频又包括音频、甚至还带有脚本的一个集合,也可以叫容器;

  文件当中的视频和音频的压缩算法才是具体的编码。也就是说一个.avi文件,当中的视频可能是编码a,也可能是编码b,音频可能是编码5,也可能是编码6,具体的用那种编码的解码器,则由播放器按照avi文件格式读取信息去调用了。

     视频编码方式介绍:

  音频视频编码方案有很多,用百家争鸣形容不算过分,目前常见的音频视频编码有以下几类

   MPEG系列:(由ISO[国际标准组织机构]下属的MPEG[运动图象专家组]开发)视频编码方面主要是Mpeg1(vcd用的就是它)、 Mpeg2(DVD使用)、Mpeg4(现在的DVDRIP使用的都是它的变种,如:divx,xvid等)、Mpeg4AVC(现在正热门);音频编码 方面主要是MPEGAudioLayer1/2、MPEGAudioLayer3(大名鼎鼎的mp3)、MPEG-2AAC、MPEG-4AAC等等。注 意:DVD音频没有采用Mpeg的。

  MPEG-l标准

   MPEG-l标准采用了一系列技术以获得高压缩比,第一,对色差信号进行亚采样,减少数据量;第二,采用运动补偿技术减少帧间冗余度;第三,做二维 DCT变换去除空间相关性;第四,对DCT分量进行量化,舍去不重要的信息,将量化后DCT分量按照频率重新排序;第五,将DCT分量进行变字长编码;第 六,对每数据块的直流分量(DC)进行预测差分编码MPEG-l中的图像类型共分四种:I图像,或称Intra图像,采用帧内编码,不参照其它图像;P图 像,或称Predicted图像,它们参照前一幅I或P图像做运动补偿编码;B图像,或称双向预测图像,它们参照前一幅和后一幅I或P图像做双向运动补偿 编码;D图像,或称直流(DC)图像,这类图像中只含直流分量,是为快放功能而设计的。MPEG视频数据流结构

  MPEG-2标准

   MPEG-2是由MPEG开发的第2个标准。按计划于1994年l1月正式确定为国际标准,MPEG-2是“活动图像及有关声音信息的通用编码” (GenericCodingofMovingPicturesAssociatedAudioInformation)标准。MPEG-2标准制定始于 1990年7月。在此之间,国际电信盟电信标准化部门(ITU-T)成立了一个有关ATM的图像编码专家组。从此开始了JTC1ITU-T的合作。从 1991年5月开始征集有关图像编码算法(VideoCodingAlgorithms)的文件,有32个公司和组织提供了非常详细的研究结果和D1格式 的编解码图像录像带。1991年ll月,在日本的JVC研究所进行了对比测试,确定带有运动补偿预测和内插的DCT最成熟和性能最好。在1992年1月的 会上又定下了MPEG-2是“通用”(generic)标准。

   MPEG-2的声音和系统部分的工作始于1992年7月。MPEG为制定MPEG-2经常与有关国际组织,如ISO、IEC、ITU-T、ITU-R等 开会协调,并注意到了与MPEG-1的兼容一致。国际电联的无线电通信部门(ITU-R)从广播电视方面提出的不同需求构成了MPEG-2的档次/等级 (Profile/Level)概念的基础。ITU-R在MPEG-2的质量检验、测试方面做了大量工作。MPEG-2的委员会草案ISO /IECCD13818是1993年l1月产生的。按计划在1994年1l月7日至l1日的新加坡会议上,批准为国际标准ISO/IECIS13818。 此后还要对MPEG-2进行扩展。

  MPEG-4标准

  MPEG-4标准将支持7个新的功能。可粗略划分为3类:基于内容的交互性、高压缩率和灵活多样的存取模式。现分别介绍如下:

  1.基于内容的交互性(Content-basedinteractivity)

  (1)基于内容的操作与比特流编辑支持无须编码就可进行基于内容的操作与比特流编辑。例如:使用者可在图像或比特流中选择一具体的对象(Object)(例如图像中的某个人,某个建筑等等),随后改变它的某些特性。

  (2)自然与合成数据混合编码提供将自然视频图像同合成数据(文本、图形)有效结合的方式,同时支持交互性操作。

  (3)增强的时间域随机存取MPEG-4将提供有效的随机存取方式:在有限的时间间隔内,可按帧或任意形状的对象,对一音、视频序列进行随机存取。例如以一序列中的某个音、视频对象为目标进行“快进”搜索。

  2.高压缩率(Compression)

  (l)提高编码效率在与现有的或正在形成的标准的可比拟速率上,MPEG-4标准将提供更好的主观视觉质量的图像。这一功能可望在迅速发展中的移动通信网中获得应用,但值得注意的是:提高编码效率不是MPEG-4的唯一的主要目际。

   (2)对多个并发数据流的编码MPEG-4将提供对一景物的有效多视角编码,加上多伴音声道编码及有效的视听同步。在立体视频应用方面,MPEG-4将 利用对同一景物的多视点观察所造成的信息冗余,MPEG-4的这一功能在足够的观察视点条件下将有效地描述三维自然景物。

  3.灵活多样的存取(Universalaccess)

   (l)错误易发环境中的抗错性(Robustness)“灵活多样”是指允许采用各种有线、线网和各种存储媒体,MPEG-4将提高抗错误能力 (Errorrobustnesscapability),尤其是在易发生严重错误的环境下的低比特应用中(移动通信链路)。注意,MPEG-4是第一个 在其音、视频表示规范中考虑信道特性的标准。目的不是取代已由通信网提供的错误控制技术,而是提供一种对抗残留错误的坚韧性。例如:选择性前向纠错 (Selectiveforwarderrorcorrection),错误遏制(Errorcontainment),或错误掩盖 (Errorconcealment)。(2)基于内容的尺度可变性(Content-basedscalability)内容尺度可变性意味着给图像中 的各个对象分配优先级。其中,比较重要的对象用较高的空间和或时间分辨率表示。基于内容的尺度可变性是MPEG-4的核心,因为一旦图像中所含对象的目录 及相应的优先级确定后,其它的基于内容的功能就比较容易实现了。对甚低比特率应用来说,尺度可变性是一个关键的因素,因为它提供了自适应可用资源的能力。 例如,这个功能允许使用者规定:对具有最高优先级的对象以可接受的质量显示,第二优先级的对象则以较低的质量显示,而其余内容(对象)则不予显示,可见, 这种方式可最有效地利用有限的资源。

  MPEG-7标准

   MPEG家族的新成员叫作“多媒体内容描述接口”(简称MPEG-7,它的由来是1+2+4=7,因为没有MPEG-3、MPEG-5、MPEG- 6),它将扩展现有内容识别专用解决方案的有限的能力,特别是它还包括了更多的数据类型。换言之,MPEG-7将规定一个用于描述各种不同类型多媒体信息 的描述符的标准集合。MPEG-7还将对定义其他描述符及其结构(描述方案),和他们之间的关系的方法进行标准化。这种描述(也就是描述符和描述方案的组 合)将与内容本身关联起来,以便对用户感兴趣的素材进行快速高效的搜索。MPEG-7将标准化一种用来定义描述方案的语言,即描述定义语言(DDL)。带 有与之相关的MPEG-7数据的AV素材,就可以被加上索引,并可进行检索。这些素材可能包括,静止图像、图形、3D模型、音频、语言、视频、以及关于这 些成份如何组成一个多媒体表述(即所谓“环境”,组合信息)的信息。在这些通用数据类型中的特殊情况可能已包括面部表情和个人特征。

   MPEG-7象MPEG家族中的其他成员一样,是针对满足特定需要的音、视频信息的标准化表述。由于MPEG-7是在其它标准表述诸如模拟、PCM、 MPEG-l、MPEG-2和MPEG-4等基础上建立起来的,而标准化的功能之一就是对其中相应部分提供参考。举例来说,也许一个用于MPEG-4的形 状描述符,在MPEG-7的环境里可能会有帮助,同样的,用于MFEG-l、MPEG-2的运动矢量区也可能有这样的情况。

   但是,MPEG-7的描述符并不依赖于它所描述的内容是编码的或存储的方式,可以把MPEG-7的描述说明,附加到模拟制的电影里或是用纸张打印出来的 图片上。然而,尽管MPEG-7的描述不依赖于所处理素材的(编码)表达方式,但由于在一定程度上它是在MPEG-4的基础上发展起来的,而MPEG-4 采用了按照具有一定时间关系(同步)和空间关系(对于视频而言是在屏幕上,对于音频而言是在房间内)的对象,来进行音、视频编码的处理方式,因此用 MPEG-4编码有可能把描述说明附加到场景中的成员(对象),比如说音、视频对象身上。所以,MPEG-7在描述中要提供不同的程度,才可能实现不同等 级的识别。

   因为描述性特征必须在应用环境中才有意义,所以他们会因用户范围的不同和应用领域的不同而有所区别。这就意昧着,同样的素材,因为要和应用范围相匹配, 可能会使用不同类型的特征来描述。我们来看一些例子,对于可视素材,较低的抽象级别可能会用一些象形状、尺寸、纹理、颜色、运动(抛射)、位置(“对象会 在场景中的哪个位置被发现呢?”)等属性来描述;对音频内容而言,可能会采用调式、情绪、节奏、节奏变化、在声场中的位置等属性。而最高的抽象等级可能会 给出关于语意的信息:“在这个场景中,左侧有一只正在吠叫的棕狗,右侧有一只落下来的蓝色圆球,背景中还有汽车经过的声音。”当然,所有这些描述都会以高 效方式进行编码,也即能提高搜索的效率。同时,中间也可能存在过渡的抽象等级。抽象等级与提取特征的方式有关,许多低等级的特征可以用全自动的方式提取出 来,而高等级的特征就需要更多的人工交互。

   视频压缩系列标准H.26x主要用于视频通信应用中,例如,基于ISDN网络的H.320框架标准的视频标准为H.261、H.262和H.263,基 于LAN网络的H.323和基于PSTN网络H.324框架标准中的视频标准为H.261和H.263。视频压缩系列标准MPEGx主要用于视频存储播放 应用中,例如,VCD中的视频压缩标准为MPEG-1,DVD中的视频压缩标准为MPEG-2。MPEG-4和H.264标准则可以广泛应用于多种领域 中,MPEG-4标准已在无线视频通信和流媒体应用中得到采用,由于H.264在压缩性能方面所具有的优势,H.264将会在实时视频通信、广播电视、视 频存储播放等领域中得到应用。

  H·261标准

   1984年国际电报电话咨询委员会的第15研究组成立了一个专家组,专门研究电视电话的编码问题,所用的电话网络为综合业务数据网络ISDN,当时的目 标是推荐一个图像编码标准,其传输速率为m×384kb/s(千位/秒),m=l,2,3,4,5。这里384kb/s在ISDN中称为Ho通道。另有基 本通道B的速率为64kb/s,6×B=384kb/s。5×Ho=30×B=1920kb/s为窄带ISDN的最高速率。后来因为384kb/s速率作 为起始点偏高,广泛性受限制,另外跨度也太大,灵活性受影响,所以改为p×64kb/s,p=l,2,3,..30。最后又把p扩展到32,因为 32×64kb/s=2084kb/s,其中2084=211,基本上等于2Mb/s,实际上已超过了窄带ISDN的最高速率1920kb/s,最高速率 也称通道容量。经过5年以上的精心研究和努力,终于在1990年12月完成和批准了CCITT推荐书H.261,即“采用p×64kb/s的声像业务的图 像编解码”,H.261简称p×64。

   由于H.261标准是用于电视电话和电视会议,所以推荐的图像编码算法必须是实时处理的,并且要求最小的延迟时间,因为图像必须和语音密切配合,否则必 须延迟语音时间。当p取l或2时,速率只能达到128kb/s,由于速率较低只能传清晰度不太高的图像,所以适合于面对面的电视电话。当p>6时,速 率>384kb/s则速率较高,可以传输清晰度尚好的图像,所以适用于电视会议。

  JPEG标准

   静像数据压缩标准JPEG(JointPhoto一graphicExpertsGroup),直译为联合摄影术专家组,其中联合是指几个国际组织的联 合。它是从1986年正式开始制订的。当时由两个国际组织联合支持,其一,是国际标准组织ISO;其二,是国际电报电话咨询委员会CCITT。到1987 年l1月,国际电工委员会IEC也参加合作,因此说JPEG是三个国际组织合作的成果。虽然从1986开始,经过许多次国际会议讨论和修改后,于1992 年7月2日表决通过标准的第一部分,但是可能对有关测试标准草案(即标准的第二部分)作进一步修改。JPEG是ISO的标准,同时也CCITT的推荐标 准。

   JPEG是数字图像压缩的国际标准。它用于连续变化的静止图像,这里包括灰度等级和颜色两方面的连续变化。JPEG包含两种基本压缩方法,各有不同的操作 模式。第一种是有损压缩,它是以DCT(DiscreteCosineTransform)为基础的压缩方法。第二种为无损压缩,又称预测压缩方法。但最 常使用的是第一种,即DCT压缩方法,也称为基线顺序编解码(BaselineSequentialCodec)方法,因为这种方法的优点是先进、有效、 简单、易于交流,因此应用广泛,是以DCT为基础的最基本、最重要的方法。

  H.264标准

  H.264压缩性能

  与以前的视频压缩标准H.261、H.263、MPEG-1、MPEG-2、MPEG-4类似,H.264也是采用帧间预测和帧内变换的混合编码方法来消除或减少图像中的信息冗余。

  但是,H.264采用了许多新技术以提高压缩效率,其主要技术特点包括:

  (1)4类DCT整数变换以及相应的量化方法;

  (2)7种宏块预测模式:16×16,16×8,8×16,8×8,8×4,4×8,4×4,运动估计和补偿更加精确;

  (3)多参考帧;

  (4)帧内预测;

  (5)改进的去块效应滤波器(Deblockingfilter);

  (6)增强的熵编码方法UVLC(UniversalVLC)、CAVLC(ContextadaptiveVLC)和CABAC;

  (7)1/4像素插值;

  (8)宏块级逐行、隔行自适应编码MBAFF。

   正是采用了这样一些切实有效的技术方法,H.264才具有了前所未有的高压缩效率,在相同的图像质量下所许的码流量更低,H.264与H.263、 MPEG-2和MPEG-4的码率节省率在相同的图像质量下,H.264所需码率约为MPEG-2的36%、H.263的51%、MPEG-4的61%, 并且随着今后实现优化性工作做得更好,其压缩性能方面的优势将更为突出。这种高压缩效率可以给视频实时通信、数字广播电视、视频存储等应用带来很多好处, 提高人们的视频欣赏质量。当然,与这种高压缩效率相伴的是H.264需要较高的实现复杂度。与MPEG-2相比,虽然H.264的压缩性能提高一倍以 上,H.264的计算复杂度也要提高两倍以上。