2024年4月25日发(作者:)

H.264

随着HDTV的兴起,H.264这个规范频频出现在我们眼前,HD-DVD和蓝光DVD均

计划采用这一标准进行节目制作。而且自2005年下半年以来,无论是NVIDIA还是ATI

都把支持H.264硬件解码加速作为自己最值得夸耀的视频技术。H.264到底是何方“神圣”

呢?

什么是H.264?H.264是一种高性能的视频编解码技术。目前国际上制定视频编解码

技术的组织有两个,一个是“国际电联(ITU-T)”,它制定的标准有H.261、H.263、

H.263+等,另一个是“国际标准化组织(ISO)”它制定的标准有MPEG-1、MPEG-2、

MPEG-4等。而H.264则是由两个组织联合组建的联合视频组(JVT)共同制定的新数字

视频编码标准,所以它既是ITU-T的H.264,又是ISO/IEC的MPEG-4高级视频编码

(Advanced Video Coding,AVC),而且它将成为MPEG-4标准的第10部分。因此,

不论是MPEG-4 AVC、MPEG-4 Part 10,还是ISO/IEC 14496-10,都是指H.264。

H.264最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的

压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。举个例子,原始文件的大小如

果为88GB,采用MPEG-2压缩标准压缩后变成3.5GB,压缩比为25∶1,而采用H.264

压缩标准压缩后变为879MB,从88GB到879MB,H.264的压缩比达到惊人的102∶1!

H.264为什么有那么高的压缩比?低码率(Low Bit Rate)起了重要的作用,和MPEG-2

和MPEG-4 ASP等压缩技术相比,H.264压缩技术将大大节省用户的下载时间和数据流量

收费。尤其值得一提的是,H.264在具有高压缩比的同时还拥有高质量流畅的图像。

H.264算法的优势

H.264是在MPEG-4技术的基础之上建立起来的,其编解码流程主要包括5个部分:

帧间和帧内预测(Estimation)、变换(Transform)和反变换、量化(Quantization)和

反量化、环路滤波(Loop Filter)、熵编码(Entropy Coding)。

H.264标准三个框架

H.264的编解码框架与以前提出的标准如H.261、H.263及MPEG-1/2/4并无显著变

化,也是基于混合编码的方案:以运动矢量代表图象序列各帧的运动内容,使用前面已解

码帧对其进行运动估计和补偿或使用帧内预测技术,所得的图象参差值要经过变换、量化、

熵编码等部分的处理。所以,新标准的性能提升在于各个部分的技术方案的改进及新算法

的应用。新标准在提高图象传输的容错性方面做了大量工作,重新定义了适于图像的结构

划分。在编码时,图象帧各部分被划分到多个slice结构中去,每个slice都可以被独立解

码不受其它部分的影响。Slice由图象最基本的结构——宏块组成,每个宏块包含一个

16×16的亮度块和两个8×8的色度块。为进一步提高鲁棒性,整个系统被划分为视频编

码层和网络抽象层。视频编码层主要描述要传输的视频数据所承载的视频内容。而网络抽

象层则是考虑不同的应用,如视频会议通信、H.32X连续包的视频传输或RTP/UDP/IP的

通信。 H.264标准分成三个框架(profile):Baseline、Main及X,代表了针对不同应用

的算法集及技术限定。其中,Baseline主要包含了低复杂度、低延时的技术特征;主要是

针对交互式的应用;考虑到了恶劣环境下的容错性,Baseline的内容基本都被其它更高级

别的profile所包含。而Main profile是针对更高编码效率的应用,如视频广播。X profile

的设计主要针对流媒体的应用,在这一框架中所有容错技术和对比特流的灵活访问及切换

技术都将包括其中。 Baseline profile的主要技术特征 ⑴ Baseline的解码器只对I slice

及P slice进行操作。对于帧间预测,相比以前的标准,为了更精确的对图象的运动内容进

行预测补偿,新标准允许宏块更进一步划分为16×16、16×8、8×16、8×8、8×4、4×8、

4×4的子块;运动估计精确到经由6-tap滤波器得到的1/4象素位置;运动矢量由相邻块