2023年11月29日发(作者:)
多媒体技术 第二讲 多媒体数据压缩技术(第1—2节)课堂笔记
及练习题
主 题: 第二讲 多媒体数据压缩技术(第1—2节)
学习时间: 4月4日--4月10日
内 容:
第二讲 多媒体数据压缩技术
第一节 多媒体数据和信息转换
一、多媒体间的信息转换
为了便于交流信息,需要对不同的媒体信息进行转换。下表是部分媒体之间
的转换关系。
转换 位图图像 图形 语音 音乐 文本 视频 数值
位图图像
图形
语音
音乐
文本
视频
数值
- * ? ? * * ?
映射 映射 冻结
** - * * * ? *
轮廓或理解 波形 乐谱 矢量化 图形化
? _ * * ? *
波形 语音合成 合成
? ** _ * ? ?
识别 音乐合成
** * * * - ? *
符号化 文字识别 识别 语音识别 转换
? - ? * * ? ?
序列化 序列化
* ** ? * ? -
计算 转换
识别
说明:*易**较困难***很困难
二、多媒体数据文件格式
多媒体文件的格式很多,下表介绍常用文件格式的特点和应用场合。
文件类型 后缀 应用场合 特点
文本文件
图形文件
图形文件
图像文件
图像文件
图像文件
声音文件
声音文件
txt 办公软件 文件小,可被所有的软件识别
wmf 办公软件 矢量文件,文件小,可反复修改
dxf 工程绘图 矢量文件,可用于工程图形交换数据
bmp 数据交换或少量使用
可被大部分软件识别,占用磁盘空间大,信息无损失,
编辑方便
jpg 图幅大,变化平缓的图像 压缩比大,图像边缘失真明显
gif 图幅大,变化锐利的图像 压缩比大
wav Windows桌面 可被大部分软件识别,占用磁盘空间大,编辑方便
mp3 较长的音乐和录音 压缩比大,失真小
第1页 共4页
动画文件
动画文件
视频文件
视频文件
视频文件
视频文件
avi Windows桌面
可被大部分软件识别,占用磁盘空间大,信息无损失,
编辑方便
矢量文件,文件小,显示清晰,便于修改,但需要专门
的插件播放
还需要有其他配套文件,视像质量低 dat VCD
还需要有其他配套文件,视像质量高 vob DVD
音视频速率均可调,可自适应网络带宽,发布费用低。 asf 网上点播,窄带传输
音视频速率均可调,视像质量较好。 rm 网上点播,窄带传输
fla 网页或多媒体课件
三、多媒体数据的信息冗余
多媒体计算机系统主要采用数字化方式,对声音、文字、图形、图像、视频
等媒体进行处理。数字化处理的主要问题是巨大的数据量。一般来说,多媒体数
据中存在以下种类的数据冗余:
1)空间冗余:一些相关性的成像结构在数字化图像中就表现为空间冗余。
2)时间冗余:两幅相邻的图像之间有较大的相关性,这反映为时间冗余。
3)信息熵冗余(编码冗余):信息熵是指一组数据所携带的信息量。如果图
像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余,这种
冗余称为信息熵冗余。
4)结构冗余:有些图像从大域上看存在着非常强的纹理结构,例如布纹图
像和草席图像,我们说它们在结构上存在冗余。
5)知识冗余:有许多图像的理解与某些基础知识有较大的相关性。这类规
律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。
6)视觉冗余:人类视觉系统对于图像场的任何变化,并不是都能感知的。
这类冗余我们称为视觉冗余。
7)其他冗余:例如由图像的空间非定常特性所带来的冗余。
以上所讲的是多媒体数据的信息冗余。设法去掉信号数据中的冗余,就是数
据压缩。
第二节 常用的数据压缩技术
一、数据压缩编码方法
1)根据解码后数据与原始数据是否完全一致来进行分类:
① 可逆编码(无失真编码),如Huffman编码、算术编码、行程长度编码等。
② 不可逆编码(有失真编码),常用的有变换编码和预测编码。
2)根据压缩的原理进行划分:
① 预测编码:它是利用空间中相邻数据的相关性,利用过去和现在出现过
的点的数据情况来预测未来点的数据。通常用的方法是差分脉冲编码调制(DPCM)
和自适应差分脉冲编码调制(ADPCM)。
② 变换编码:该方法将图像光强矩阵(时域信号)变换到频域空间上进行处
理。一般采用正交变换,如离散余弦变换(DCT)、离散傅立叶变换(DFT)和
Walsh-Hadamard变换(WHT),来实现压缩算法。
③ 量化与向量量化编码:对模拟信号进行数字化时要经历一个量化的过程。
为了使整体量化失真最小,就必须依照统计的概率分布设计最优的量化器;除了
每次仅量化一个对像元点的做法外,也可以考虑一次量化多个点的做法,这种方
第2页 共4页
法称为向量量化。
④ 信息熵编码:根据信息熵原理,让出现概率大的用短码字表达,反之用
长的码字表示。最常见的方法如Huffman编码、Shannon编码以及算术编码。
⑤ 子带(subband)编码:将图像数据变换到频域后,按频域分带,然后用不
同的量化器进行量化,从而达到最优的组合。
⑥ 模型编码:编码时首先将图像中的边界、轮廓、纹理等结构特征找出来,
然后保存这些参数信息。解码时根据结构和参数信息进行合成,恢复原图像。
二、预测编码
预测编码有线性预测和非线性预测两类。DPCM(线性预测差分脉冲编码调制)
的基本原理是基于图像中相邻像素之间具有较强的相关性,每个像素可通过以前
已知的几个像素来作预测。在预测编码中,编码和传输的并不是像素采样值,而
是这个采样值的预测值与其实际值之间的差值。
DPCM系统中的误差来源是发送端的量化器,而与接收端无关。事实上,这
种量化误差是不可避免的。
三、变换编码
变换编码是利用频域中能量较集中的特点,在频域(变换域)上进行变换。利
用离散余弦变换(DCT)、离散傅立叶变换(DFT)和Walsh-Hadamard变换(WHT)等,
使协方差矩阵接近为一个对角阵。输入的图像经过其协方差矩阵正交变换后形成
频域空间,像素之间相关性下降,能量集中在变换域中少数变换系数上,达到数
据压缩的效果。
预测编码和变换编码都是有失真编码,或者说是不可逆编码。
四、信息熵编码
信息熵编码又称为统计编码,它是根据信源符号出现概率的分布特征而进行
的压缩编码。
a. Huffman编码
Huffman编码方法的理论基础:在变长编码中,对出现概率大的信源符号赋
予短码字,而对于出现概率小的信源符号赋予长码字。如果码字长度严格按照所
对应符号出现概率大小的逆序排列,则编码结果平均码字长度一定小于任何其他
排列方式。Huffman编码是一种常用的无失真编码。
b. 算术编码
其基本原理是将编码的信息表示成实数0和l之间的一个间隔(interval),
信息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位就越多。
算术编码的特点是:
① 不必预先定义概率模型,自适应模式具有独特的优点;
② 信源符号概率接近时,建议使用算术编码。
Huffman编码和算术编码都是无失真编码。
本周应掌握的知识要点:
1、多媒体数据的信息冗余有哪些?
2、常用的数据压缩技术有哪些?基本原理与特点是什么?
练习:
一、问答题:
1、多媒体数据中存在哪些种类的数据冗余?
2、根据解码后数据与原始数据是否完全一致以及根据压缩的原理来进行分类,
第3页 共4页
分别可以将数据压缩方法分成哪些类?
1、答:一般来说,多媒体数据中存在以下种类的数据冗余:空间冗余、时间冗
余、信息熵冗余、结构冗余、知识冗余、视觉冗余以及其他冗余。
2、答:根据解码后数据与原始数据是否完全一致,数据压缩方法一般被划分为
两类:可逆编码(无失真编码,如Huffman编码、算术编码、行程长度编码等)、
不可逆编码(有失真编码,常用的有变换编码和预测编码);根据压缩的原理进行
划分,可以有以下几类:预测编码、变换编码、量化与向量量化编码、信息熵编
码、子带编码、模型编码。
二、选择题:
1、常用的数据压缩编码方法中,具有“无失真”特点的编码方法是(。 )
A.Huffman编码
B.算术编码
C.变换编码
D.预测编码
2、多媒体包括( )。
A.数值
B.图像
C.图形
D.音乐
第4页 共4页


发布评论