2024年3月31日发(作者:)
视频压缩技术有:MPEG-4、H263、H263+、H264等
MPEG-4视频编码技术介绍
MPEG是“Moving Picture Experts Group”的简称,在它之前的标准叫做JPEG,即“Joint
Photographic Experts Group”。当人们用到常见的“.jpg”格式时,实际上正在使用JPEG的标准。JPEG规
范了现代视频压缩的基础,而MPEG把JPEG标准扩展到了运动图象。 MPEG-4视频编码标准支持
MPEG-1、MPEG-2中的大多数功能,它包含了H.263的核心设计,并增加了优先特性和各种各样创造性
的新特性。它提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码,同时也支持基于内容的图
像编码。采纳了基于对象(Object-Based)的编码、基于模型(Model-based)的编码等第二代编码技术是
MPEG-4标准的主要特征。
MPEG4与MPEG1、MPEG2的比较
MPEG 系列标准的基本参数
标准 幅面
352x24 或
320x240
720x24 或
640x480
34x48 ~
4096x4096
帧率 带宽 应用领域
MPEG-1 24-30 fps 1.5 Mbps Video CD, CD-ROM
MPEG-2 24-30 fps 4-8 Mbps DTV,HDTV,DVD-Video
互联网及无线传输,交互式
电视
MPEG-4 1-30+fps 10Kbps~10Mbps
从上表可以看出,MPEG1和MPEG2主要应用于固定媒体,比如 VCD 和 DVD ,而对于网络传输,
MPEG4具有无可比拟的优势。
H.263/H.263+/H.264视频编码技术介绍
H.263视频编码标准
1. H.263 是最早用于低码率视频编码的ITU-T标准,随后出现的第二版(H.263+)及H.263++增加了
许多选项,使其具有更广泛的适用性。H.263是 ITU-T为低于64kb/s的窄带通信信道制定的视
频编码标准。它是在H.261基础上发展起来的,其标准输入图像格式可以是S-QCIF、QCIF、 CIF、
4CIF或者16CIF的彩色4∶2∶0亚取样图像。H.263与H.261相比采用了半象素的运动补偿,
并增加了4种有效的压缩编码模式。
H.263+视频压缩标准
1. ITU-T在H.263发布后又修订发布了H.263标准的版本2,非正式地命名为H.263+标准。它在保
证原H.263标准核心句法和语义不变的基础上,增加了若干选项以提高压缩效率或改善某方面的
功能。原H.263标准限制了其应用的图像输入格式,仅允许5种视频源格式。H.263+标准允许更
大范围的图像输入格式,自定义图像的尺寸,从而拓宽了标准使用的范围,使之可以处理基于视
窗的计算机图像、更高帧频的图像序列及宽屏图像。为提高压缩效率, H.263+采用先进的帧内
编码模式;增强的PB-帧模式改进了H.263的不足,增强了帧间预测的效果;去块效应滤波器不
仅提高了压缩效率,而且提供重建图像的主观质量。为适应网络传输,H.263+增加了时间分级、
信噪比和空间分级,对在噪声信道和存在大量包丢失的网络中传送视频信号很有意义;另外,片
结构模式、参考帧选择模式增强了视频传输的抗误码能力。
H.264视频压缩标准
1. H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准。对信道时
延的适应性较强,既可工作于低时延模式以满足实时业务,如会议电视等;又可工作于无时延限
制的场合,如视频存储等。
1
2. 提高网络适应性,采用“网络友好”的结构和语法,加强对误码和丢包的处理,提高解码器的差错
恢复能力。
3. 在编/解码器中采用复杂度可分级设计,在图像质量和编码处理之间可分级,以适应不同复杂度的
应用。
4. 相对于先期的视频压缩标准,H.264引入了很多先进的技术,包括4×4整数变换、空域内的帧内
预测、1/4象素精度的运动估计、多参考帧与多种大小块的帧间预测技术等。新技术带来了较高的
压缩比,同时大大提高了算法的复杂度。
G.7xx系列典型语音压缩标准介绍
G.7xx 是一组 ITU-T 标准,用于视频压缩和解压过程。它主要用于电话方面。
在电话学中,有两个主要的算法,分别定义在 mu-law 算法(美国使用)和 a-law 算法(欧洲及世界其
他国家使用),两者都是对数关系,但对于计算机的处理来说,后者的设计更为简单。
国际电信联盟G系列典型语音压缩标准的参数比较:
算法
G.711
G.722
G.723.1
G.726
G.727
G.728
G.729
类型
A-Law / μ -Law
SB-ADPCM
MP-MLQ/ACELP
ADPCM
Embedded ADPCM
LD-CELP
CS-ACELP
64
64/56/48
6.3/5.3
16/24/32/40
16/24/32/40
16
8
码率(kbit/s) 算法延时(ms)
0
0
37.5
0
0
< 2
15
在国际标准中,统一使用 MOS(Mean Opinion Score)方法评价语音压缩后的质量。在MOS方法中,
电话语音质量的标准定为4分。也就是说,如果一种算法将语音压缩后,MOS 值能Global IP Sound(简
称GIPS)
Global IP Sound(简称GIPS),是瑞典一家全球顶级的专业从事语音编解码引擎的技术公司。是一家
位于瑞典斯德戈尔摩的高技术上市公司,成立于1999年,目前只有25位员工,但却拥有世界上最顶尖的
语音处理和IP电话技术专家:其公司CTO,Roar Hagen博士,1989年即进入语音处理行业从事开发工
作,在世界知名的AT&T贝尔实验室、爱立信研究院工作。他本人发明了超过10项技术专利。
Jan Linden博士,在语音处理和通讯领域从业12年。在加入Global IP Sound之前,Jan Linden博士
在加州大学和SingnalCom公司供职。Patrik Srqvist,自1995年开始从事语音处理和VoIP研究开发工作,
之前在爱立信研究院工作。
就是这样一家规模小同时却拥有来自爱立信、 AT&T等电信行业巨头的技术专家的公司,却在VoIP引
擎市场上取得了令人瞩目的成就。GIPS SoundWare能为端对端 IP 通信提供较 PSTN 质量更佳的语音
体验及保真度,完全不会受数据包丢失的影响。
达到4分,即说明其语音质量和电话质量等同,用户无法分辨出其中的区别。
2


发布评论