2024年4月11日发(作者:)
块截断编码图像压缩技术
摘要
由于多媒体技术的发展,图像压缩技术成为图像处理中研究的热点。
编码压缩技术的发展,使大容量图像信息的存储与传输得以实现,并且解
决了多媒体等新技术在实际应用中遇到的各种困难。
论文先介绍了当前流行的图像压缩技术,重点介绍块截断编码技术,
先从理论上介绍块截断编码原理,块截断编码是一种有效、快速的数字图
像压缩技术,作为一种经典的图像压缩编码,块截断编码技术的实时性很
强。论文介绍了两种块截断编码算法,一种是标准的块截断编码算法,另
外一种是改进的块截断算法即绝对矩块截断算法。在图像压缩性能评价
中,常用的准则有客观保真度与主观保真度。其中客观评价主要采用峰值
信噪比(PSNR)和均方误差(MSE)这两种方法,主观评价是指人对图像质量
的主观感觉。论文选取三幅图像,分别用这两种算法对这三种图像进行压
缩,观察压缩后图像的质量及每幅图像压缩时的峰值信噪比(PSNR)和均方
误差(MSE)来评价这两种方法。总结这两种方法各自的特点。
实验证明,标准的块截断图像编码算法快速容易实现,而且它对信道
误码不敏感,实时性比较强,图像质量比较好;绝对矩块截断编码不仅具
备了以上的优点,而且运算处理更加迅速,并且较好的保留了图像的边
缘,获得了更高的图像质量。
关键词 图像压缩;块截断编码;量化电平
- I -
Block Truncation Coding Image Compression
Technology
Abstract
With the development of multimedia technology, the image compression
has become more and more important in the field of image processing. Thanks
for the development of coding compression techniques, large-capacity image
can been saved, information can transport with each other and encountered a
variety of difficulties which come from the resolution of multi-media and other
new technology in the practical application.
First of this paper introduced several popular image compression
technology. It deeply researched and analyzed block truncation coding image
compression technology. Theory first introduced the principle of block
truncation coding, block truncation coding is an effective, fast digital image
compression technology, as a classic image compression coding, block
truncation coding techniques are highly real-time. This paper introduces two
kinds of block truncation coding algorithm, one is standard cut block coding
algorithm, another is to improve the block truncation algorithm that is an
absolute moment block truncation algorithm. In image compression,
performance evaluation, the commonly used criteria are objective fidelity. and
subjective fidelity. Objective evaluation mainly use two methods, peak signal to
noise ratio (PSNR) and Mean Square Error (MSE), subjective evaluation refer
to the of image quality on a subjective feeling. Papers selected three images,
respectively, use these two algorithms to compress the three images, observe of
the quality of compressed images and each image compression at the time of
peak signal to noise ratio (PSNR) and Mean Square Error (MSE) to evaluate
these two methods. This paper summarizes the characteristics of the two
algorithms. Papers compared the experimental results that came from the
- II -
experiments on the two algorithms in the paper, and the results verified the
superiority of the block truncation coding image compression techniques.
Experiments show that block truncation algorithm essentially is very simple,
besides it is not sensitive with its channel BER, and has well real-time of
relatively, also can retain satisfactory image quality.
Keywords
- III -
image compression; block truncation coding; quantify the level
目录
摘要 ...................................................................................................................... I
Abstract ............................................................................................................... II
第1章 绪论 .......................................................................................................... 5
1.1 研究背景及意义 ....................................................................................... 5
1.2 图像压缩技术现状 ................................................................................... 5
1.3 论文的主要工作 ....................................................................................... 9
第2章 图像压缩技术 ........................................................................................ 10
2.1 图像压缩技术概述 ................................................................................. 10
2.2 图像压缩技术分类 ................................................................................. 10
2.3 图像压缩技术原理 ................................................................................. 13
2.4 本章小结 ................................................................................................. 14
第3章 块截断编码原理 .................................................................................... 15
3.1块截断编码概述 ....................................................................................... 15
3.2 块截断编码基本原理 ............................................................................. 15
3.3 典型块截断编码方法 ............................................................................. 17
3.4 本章小结 ................................................................................................. 20
第4章 图像压缩实验 ........................................................................................ 21
4.1 压缩评价准则 ......................................................................................... 21
4.2 块截断编码图像压缩实验 ..................................................................... 22
4.2.1 实验步骤 .......................................................................................... 22
4.2.2 实验结果及分析 .............................................................................. 24
4.3 本章小结 ................................................................................................. 27
结论 .................................................................................................................... 28
参考文献 ............................................................................................................ 29
致谢 .................................................................................................................... 31
附录 .................................................................................................................... 32
- IV -
第1章 绪论
1.1 研究背景及意义
二十世纪末,人类社会开始进入到数字化时代,数字图像技术作为数
字技术的重要组成部分,将人们带入了崭新的多媒体世界。随着科学的发
展和社会的进步,人们对图像信息的需求也越来越大。在多媒体计算机系
统、电子出版、视频会议、数字化图书馆等许多领域,数字图像都有着广
泛的应用。然而,大量的图像数据量使得存储成本越来越高,不能满足现
今网络环境下多媒体通信的需求。因此,图像编码应运而生并迅速发展起
来。
图像编码,即图像压缩,就是在保证一定重构质量的前提下,通过去
除图像中的各种冗余,以尽量少的比特数来表征图像信息。传统的图像编
码是以香农信息论为出发点,用统计概率模型来描述信源
[1]
。编码实体是
像素或像素块,以消除数据相关冗余为目的,由此产生的JPEG、MPEG-
1、MPEG-2、H.261及H.263等编码国际标准己经获得了很大的成功。新
一代基于内容的图像编码方法,充分考虑了信息接收者的主观特性、图像
信息的具体含义和重要程度,以消除图像内容为目的,是目前一个较为活
跃的研究领域。
一幅图像的数字表示需要很大的比特数。图像压缩的目的在于降低这
个比特数到最小程度并且重现原始图像的忠实样本。图像压缩的早期研究
是以讯息理论作为指导思想的,并得出许多种压缩方法。普通压缩方法的
压缩比为10:1,目前,人视觉的脑机理的研究开拓了图像压缩技术的新纪
元,可使压缩比达到100:1。
常用的压缩方法包括冗余度压缩法、熵压缩法、变换编码、块截断编
码等,其中块截断编码虽然压缩比不高(一般为4:1左右),但是具有简
单、快速、易实现,对信道误码不敏感,还能够获得较高的图像质量,所
以长期以来一直受到人们的重视。特别是在计算机技术很发达的今天,它
的实时实现十分容易,块截断算法,可以用纯软件方式完成对活动图像压
缩,而MPEG等算法不能做到这一点。从理论上讲,块截断算法能够保持
信号样本的一阶矩和二阶矩使译码图像在一定程度上保持了原图像的局部
统计特性。因此,本文研究块截断编码图像压缩技术及其实现。
1.2 图像压缩技术现状
从图像压缩编码的发展过程来说,可以分成三个阶段:第一代,着重
于图像信息冗余度的压缩方法。第二代,着重于图像视觉冗余信息的压缩
- V -
方法。第三代基于模型的图像压缩方法。
数据压缩的理论研究开始于Shannon的信息论。1948年Shannon的经
典论文《通信的数学原理》中首次提到了信息率——失真函数概念,1959
年又进一步确立了失真率理论,从而奠定了信源编码的理论基础
[2]
。从此
理论出发不难得到数据压缩的两种基本途径:其一,设法改变信源的概率
分布,使其尽可能地非均匀,再用最佳编码方法使平均码长逼近信源熵;
其二,联合信源的冗余度也寓于信源间的相关性之中。去除它们之间的相
关性,使之成为或差不多成为不相关信源。
经典方法中的无损压缩方法,如Huffman编码、算术编码、游程编码
等,基于上述的基本途径之一,其压缩效率都以其熵为上界,故其压缩比
饱和于l0:1左右。有损压缩方法,如预测编码、变换域编码、混合编码、
矢量量化、块截断编码等基于基本途径之二,同时也大都受信息熵的约
束。
虽然经典方法依据了图像本身固有的统计特性和利用人视觉系统的某
些特性进行压缩编码,但是利用得还不够充分,且伴随着感知生理——心
理学的发展,人们越来越清楚地认识到:人的视觉感知特点与统计意义上
的信息分布并不一致,即统计上需要更多的信息量才能表征特征,对视觉
感知可能并不重要。从感知角度来讲,无需详细表征这部分特征。这时,
压缩技术的研究就突破了传统Shannon理论的框架,注重对感知特性的利
用,即利用所谓的“感知熵”理论,使得压缩效率得以极大提高,因此称
其为现代压缩编码方法。
伴随着数学理论,如小波变换、分形几何理论、数学形态学等以及相
关学科,如模式识别、人工智能、神经网络、感知生理心理学等的深入发
展,新颖高效的现代压缩方法相继产生。现代压缩方法又称为分析与综合
方法。目前图像压缩编码技术的研究除了更好的实现现有的国际标准以
外,又出现了许多新的图像编码方法,主要有多分辨率编码、基于表面描
述编码、模型编码、人工神经网络编码、分形几何编码、数学形态学编码
等
[3]
。其中分形图像压缩和小波图像压缩是当前研究的热点。下面针对目
前典型的图像压缩方法进行以下综述。
1.JPEG压缩:负责开发静止图像压缩标准的“联合图片专家组”
(Joint Photographic Expert Group,简称JPEG),于1989年1月形成了基于自
适应DCT的JPEG技术规范的第一个草案,其后多次修改,至1991年形
成ISO10918国际标准草案,并在一年后成为国际标准,简称JPEG标准
[4]
。
JPEG算法中首先对图像进行分块处理,一般分成互不重叠的 大小的
块,再对每一块进行二维离散余弦变换(DCT)。变换后的系数基本不相
关,且系数矩阵的能量集中在低频区,根据量化表进行量化,量化的结果
- VI -
保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag
扫描重新组织,然后进行哈夫曼编码。JPEG的优点是具有中端和高端比
特率上的良好图像质量。缺点是:由于对图像进行分块,在高压缩比时产
生严重的方块效应;压缩比不高,小于50。
JPEG压缩图像出现方块效应的原因是:一般情况下图像信号是高度
非平稳的,很难用Gauss过程来刻画,并且图像中的一些突变结构例如边
缘信息远比图像平稳性重要,用余弦基作图像信号的非线性逼近其结果不
是最优的。
针对JPEG在高压缩比情况下,产生方块效应,解压图像较差,近年
来提出了不少改进方法,最有效的是下面的两种方法: DCT零树编码、
层式DCT零树编码。
2.JEPG2000压缩:JPEG2000是由ISO/IEC JTCISC29标准化小组负
责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了
余弦变换。2000年3月的东京会议,确定了彩色静态图像的新一代编码方
式—JPEG2000图像压缩标准的编码算法
[4]
。
JPEG2000格式的图像压缩比,可在现在的JPEG基础上再提高
10%~30%,而且压缩后的图像显得更加细腻平滑。对于目前的JPEG标
准,在同一个压缩码流中不能同时提供有损和无损压缩,而在JPEG2000
系统中,通过选择参数,能够对图像进行有损和无损压缩。现在网络上的
JPEG图像下载时是按“块”传输的,而JPEG2000格式的图像支持渐进传
输,这使用户不必接收整个图像的压缩码流。由于JPEG2000采用小波技
术,可随机获取某些感兴趣的图像区域(ROI)的压缩码流,对压缩的图像
数据进行传输、滤波等操作。
JPEG2000标准适用于各种图像的压缩编码。其应用领域将包括
Internet、传真、打印、遥感、移动通信、医疗、数字图书馆和电子商务
等。JPEG2000图像压缩标准将成为21世纪的主流静态图像压缩标准。
3.小波变换图像压缩:小波变换用于图像编码的基本思想就是把图
像根据Mallat塔式快速小波变换算法进行多分辨率分解。其具体过程为:
首先对图像进行多级小波分解,然后对每层的小波系数进行量化,再对量
化后的系数进行编码。小波图像压缩是当前图像压缩的热点之一,已经形
成了基于小波变换的国际压缩标准,如MPEG-4标准,及如上所述的
JPEG2000标准。
目前3个最高等级的小波图像编码分别是嵌入式小波零树图像编码
(EZW),分层树中分配样本图像编码(SPIHT)和可扩展图像压缩编码
(EBCOT)。
小波图像压缩被认为是当前最有发展前途的图像压缩算法之一。小波
图像压缩的研究集中在对小波系数的编码问题上。在以后的工作中,应充
- VII -
分考虑人眼视觉特性,进一步提高压缩比,改善图像质量。并且考虑将小
波变换与其他压缩方法相结合。例如与分形图像压缩相结合是当前的一个
研究热点。
4.分形图像压缩:1988年,Barnsley通过实验证明分形图像压缩可
以得到比经典图像编码技术高几个数量级的压缩比。1990年,Barnsley的
学生n提出局部迭代函数系统理论后,使分形用于图像压缩在
计算机上自动实现成为可能。
分形压缩主要利用自相似的特点,通过迭代函数系统(Iterated Function
System, IFS)实现。其理论基础是迭代函数系统定理和拼贴定理。
分形图像压缩把原始图像分割成若干个子图像,然后每一个子图像对
应一个迭代函数,子图像以迭代函数存储,迭代函数越简单,压缩比也就
越大。同样解码时只要调出每一个子图像对应的迭代函数反复迭代,就可
以恢复出原来的子图像,从而得到原始图像。随着分形图像压缩技术的发
展,越来越多的算法被提出,基于分形的不同特征,可以分成以下几种主
要的分形图像编码方法:尺码编码方法、迭代函数系统方法、A-E-Jacquin
的分形方案。
虽然分形图像压缩在图像压缩领域还不占主导地位,但是分形图像压
缩既考虑局部与局部,又考虑局部与整体的相关性,适合于自相似或自仿
射的图像压缩,而自然界中存在大量的自相似或自仿射的几何形状,因此
它的适用范围很广。
近年来块截断编码的研究也取得了可喜的成果。块截断编码(Block
Truncation Coding,简称BTC)作为一种经典的压缩方法,虽然比起来现代的
压缩技术压缩比不高(它的压缩比一般为4:1左右),编码性能不如DCT技
术,但是因为它具有简单、快速的实现算法,对信道误码不敏感,还能够
获得令人满意的图象质量,所以长期以来一直受到人们的重视。特别是在
计算机技术很发达的今天,它的实时实现十分容易,在军事领域和卫星传
输方面都有很大的应用前景。
1979年,和ll最先提出了块截断图象编码算法,
此后陆续出现了许多关于块截断编码的改进算法和自适应的或混合的块截
断编码方案
[5]
。ll等人系统地比较了各种块截断算法性能的优劣
和运算复杂度的高低。近年来,块截断编码越来越多的与其他方法结合应
用于各个领域。涂国防等人提出了一种新的纯软件视频编解码算法 ,利
用改进的块截断编码和基于一步预测运动估计的运动补偿技术 ,该算法能
够在现有的普通PC机上实时实现全彩色视频电话图像序列的编解码。
王业奎等人提出了一种新的活动图像编码算法,称为自适应多值量化的
亚抽样块截断编码。模拟结果表明:这种新算法比现有的其它同类算法有更
好的性能,压缩比为30,信噪比为35.4dB,图像主观质量良好,在现有
- VIII -
个人计算机上可以用软件实时实现。
陆哲明等人提出了一种块截断编码的改进算法,用一种快速查表法来
编码高低电平,用24个视觉模型来编码4×4二进制位图,实验表明这种
方法可以快速编码和解码,并且能够有效的提高压缩比。
复旦大学计算机系教授薛向阳等人提出了一种改进的块截断编码算
法,从理论上讲,块截断编码算法能够保持信号样本的一阶矩和二阶矩,
使译码图象在一定程度上保持了原图象的局部统计特性,但是从目前已经
提出的各种块截断编码算法来看,它们都是二电平量化器,都将图象量化
成高低两个电平值,因此在译码图象中不可避免地出现方块失真,特别是
在图象边缘处出现明显的阶梯现象。为克服这一缺点,用低通滤波器对
BTC量化后的二值图象块进行平滑,使得块失真有所改善,实验表明本方
案还能够明显提高重建图象的峰值信噪比。
T.M. Amarunnishad 等人提出了一种应用模糊边缘补偿算子改进块截
断编码压缩的方法,改方法用模糊逻辑比特块来替换传统块截断编码方
法。该模糊逻辑块是在模糊边缘图像中使用耶格尔合补充边缘模糊算子得
到。实验表明,本方法较传统块截断编码方法在视觉质量上和峰值信噪比
上都有所改进。
目前有许多基于块截断编码的改进算法,分别在提高压缩率和提高图
像的压缩质量几个方面有了明显的进展。
本文主要研究标准的块截断编码算法和改进的块截断编码算法,并完
成对这两种算法的实现。
1.3 论文的主要工作
1.综述了图像编码技术的现状,介绍了现代图像编码方法和经典图
像编码方法,对于图像编码原理给出了理论说明。
2.详细介绍了块截断编码方法,从原理上分析比较了几种块截断编
码方法的特点。
3.对原始的块截断编码算法和改进的块截断算法进行实验实现,通
过对实验结果的观察分析,比较总结这两种算法的优缺点。
- IX -
第2章 图像压缩技术
2.1 图像压缩技术概述
在过去的20多年里,微电子、计算机和传感器技术取得了突飞猛进
的发展。数字图像的获取、数字处理、存储、传输、显示等技术也因此获
得了极大的成功。但是,当前随着人们对图像、声音等多媒体信息的需求
越来越大,如果直接把未经压缩的图像数据用于交换和存储,那么数据的
大小还是会远远超出已有的存储技术和网络带宽。不过,把图像数据进行
适当的压缩,则可能使图像数据大小减小几十倍甚至上百倍。显然,数字
图像压缩有着重大的实用价值和广阔的发展前景。
图像编码与压缩从本质上来说就是对要处理的图像原始数据按一定的
规则进行变换和组合,从而达到以尽可能少的代码(符号)来表示尽可能多
的数据信息。压缩通过编码来实现,或者说编码带来压缩的效果。所以,
一般把此项处理称之为压缩编码。例如,一幅512×512、灰度等级为8比
特的图像,其数据量为256K字节。以四通道卫星遥感探测器为例,以此
视窗,一个时次即达1M字节。实际上,卫星遥感探测时,视窗远大于
此,通道远多于此。如地球同步卫星,探测范围达全球面积的三分之一。
试想,要保存这些图像数据,该需要多大的存储空间。在现代通信中,图
像传输已成为重要的内容。在工作中除要求设备可靠、图像保真度高以
外,实时性将是重要技术指标之一。很显然,在信道带宽、通信链路容量
一定的前提下,采用编码压缩技术,减少传输数据量,是提高通信速度的
重要手段。
可以这样认为,没有编码压缩技术的发展,大容量图像信息的存储与
传输是难以实现的,多媒体等新技术在实际中的应用也会碰到困难。
2.2 图像压缩技术分类
数字图像压缩简称图像压缩,有时又称为图像压缩编码或图像编码,
从对象上看分为静止图像压缩和运动图像压缩。
图像压缩研究始于1948年,针对电视图像传输而提出的脉冲编码调
制(PCM)原理。20世纪五、六十年代进行的研究限于图像的帧内编码(如预
测法)、子抽样/内插复原、图像的统计特性和视觉特性等等。从20世纪60
年代末开始,正交变换方法和其它方法被陆续提出,并对图像的帧间编码
(即运动图像编码)做了初步探讨。1969年举行的首届“图像编码会
议”表明图像压缩编码己作为一个相对独立的学科出现。1988年是图像压
缩编码发展极为重要的一年,视频压缩标准H261和静止图像压缩标准
- X -
JPEG的框架原理基本确定,分形和神经网络在图像压缩编码中取得重要
进展,因此,1988年以前主要研究的压缩编码方法通常称为“经典方法”
或“传统方法”,其后提出的具有重要发展前景的方法称为“现代方法”。
现代编码方法:
1.模型法编码:模型编码将图像信号看作三维世界中的目标和景物
投影到二维平面的产物,而对这一产物的评价是由人类视觉系统的特性决
定的。模型编码的关键是对特定的图像建立模型,并根据这个模型确定图
像中景物的特征参数,如运动参数、形状参数等。解码时则根据参数和已
知模型用图像合成技术重建图像。由于编码的对象是特征参数,而不是原
始图像,因此有可能实现比较大的压缩比。模型编码引入的误差主要是人
眼视觉不太敏感的几何失真,因此重建图像非常自然和逼真。
2.分形编码法:分形法是基于物质的自相似性,在编码时将信号分
解为若干分形子图,提取其迭代函数系统代码(IFS代码)。恢复时则由该代
码按规律迭代重构各子图。基于IFS的分形法编码压缩过程应包括以下步
骤:
(1) 将原图预分割成若干分形子图,使每一子图具有一定的分形结
构。目前这一步需要采用图像处理、计算机视觉和模式识别的技术,经过
反复试凑才能完成。
(2) 对每一子图提取IFS代码。即将子图置于计算机屏幕上,采用伸
缩、平移、旋转或仿射手段,对子图进行压缩,获得一组仿射变换参量,
便可得到该子图的IFS代码。
(3) 对IFS代码采用经典的编码方法进行编码。
(4) 译码形成IFS代码。
(5) 由IFS代码,利用随机迭代法获取相应的重构子图。
(6) 把各重构子图拼成恢复图像。对于一定的整体与局部存在明显相
似性或仿射性的分形图像类,这种方法可以取得很高的压缩比。
3.小波变换压缩方法:小波变换把图像分解成逼近图像和细节图像
之和,它们分别代表图像的不同结构,然后采用快速算法(Mallat)进行压
缩,可以获得很高的压缩比。基于小波变换的图像压缩算法首先使用某种
小波基函数将图像作小波变换,再根据4个通道的不同情况,分别量化编
码,比如对低频频段(LL)采用较多的量化级别,而对中间频段(LH,RH)采
用较少量化级别,对高频频段(HH)采用很少几个量化级别,这样根据重构
时对复原信号的重要程度分别对待的方式可以有效地提高压缩比而又不产
生明显的失真
[6]
。小波变换在静态图像压缩中的作用已经得到公认,为
JPEG2000标准所采纳。小波变换应用于图像压缩时,本质上是对原始图
像的小波系数进行重组处理,然后用处理后的小波系数恢复图像,在实际
的信号压缩标准中(如JPEG2000),一般采用支集长度为9和7的双正交小
- XI -
波,该方法容错性比较好,因此更适合实际的应用。
经典编码方法:
1.行程长度编码(RLE):行程长度编码(run-length encoding)是压缩一
个文件最简单的方法之一。它的做法是把一系列的重复值(例如图像像素的
灰度值)用一个单独的值再加上一个计数值来取代。比如有这样一个字母序
列aabbbccccccccdddddd,它的行程长度编码就是2a3b8c6d。这种方法实现
起来很容易,而且对于具有长重复值的串的压缩编码很有效。例如对于有
大面积的连续阴影或者颜色相同的图像,使用这种方法压缩效果很好。很
多位图文件格式都用行程长度编码,例如TIFF,PCX, GEM等。
2 .LZW编码:LZW编码原理是将每一个字节的值都要与下一个字
节的值配成一个字符对,并为每个字符对设定一个代码。当同样的一个字
符对再度出现时,就用代号代替这一字符对,然后再以这个代号与下个字
符配对。LZW编码原理的一个重要特征是,代码不仅仅能取代一串同值
的数据,也能够代替一串不同值的数据。在图像数据中若有某些不同值的
数据经常重复出现,也能找到一个代号来取代这些数据串。在此方面,
LZW压缩原理是优于RLE的。
3.霍夫曼编码:霍夫曼编码(Huffman encoding)是通过用不固定长度
的编码代替原始数据来实现的。霍夫曼编码最初是为了对文本文件进行压
缩而建立的,迄今已经有很多变体。它的基本思路是出现频率越高的值,
其对应的编码长度越短,反之出现频率越低的值,其对应的编码长度越
长。
4.预测及内插编码:一般在图像中局部区域的象素是高度相关的,
因此可以用先前的象素的有关灰度知识来对当前象素的灰度进行预计,这
就是预测。而所谓内插就是根据先前的和后来的象素的灰度知识来推断当
前象素的灰度情况。如果预测和内插是正确的,则不必对每一个象素的灰
度都进行压缩,而是把预测值与实际象素值之间的差值经过熵编码后发送
到接收端。在接收端通过预测值加差值信号来重建原象素。
5.矢量量化编码:矢量量化编码利用相邻图像数据间的高度相关
性,将输入图像数据序列分组,每一组m个数据构成一个m维矢量,一
起进行编码,即一次量化多个点。根据仙农率失真理论,对于无记忆信
源,矢量量化编码总是优于标量量化编码。编码前,先通过大量样本的训
练或学习或自组织特征映射神经网络方法,得到一系列的标准图像模式,
每一个图像模式就称为码字或码矢,这些码字或码矢合在一起称为码书,
码书实际上就是数据库。输入图像块按照一定的方式形成一个输入矢量。
编码时用这个输入矢量与码书中的所有码字计算距离,找到距离最近的码
字,即找到最佳匹配图像块。输出其索引(地址)作为编码结果。解码过程
与之相反,根据编码结果中的索引从码书中找到索引对应的码字(该码书必
- XII -
须与编码时使用的码书一致),构成解码结果。由此可知,矢量量化编码是
有损编码。目前使用较多的矢量量化编码方案主要是随机型矢量量化,包
括变换域矢量量化,有限状态矢量量化,地址矢量量化,波形增益矢量量
化,分类矢量量化及预测矢量量化等。
6.块截断编码:1979年,和ll提出了块截断图象
编码算法,此后陆续出现了许多关于块截断编码的改进算法和自适应的或
混合的块截断编码方案,最近,ll等人又系统地比较了各种
BTC算法性能的优劣和运算复杂度的高低.。
虽然BTC的压缩比不高(一般为4:1左右),编码性能不如DCT技
术,但是因为它具有简单、快速的实现算法,对信道误码不敏感,还能够
获得令人满意的图象质量,所以长期以来一直受到人们的重视.特别是在计
算机技术很发达的今天,它的实时实现十分容易,因此本文着重研究块截
断编码技术。
2.3 图像压缩技术原理
在信息论中,通过减少图像冗余而进行的数据压缩处理为信源编码。
信源编码器的组成,即图像压缩编码的基本原理框图如下:
原始图像
变换器
量化器
编码器 编码输出
图2-1图像压缩编码的基本原理框图
典型的图像压缩系统主要由三部分组成:变换部分(Transformer)、量
化器 (Quantizer)、和编码部分(Coder)。
变换部分完成对图像信息恰当的分解与表征,改变图像数据的特性,
去除图像空间域、时间域、频率域冗余度,使之便于进行压缩编码。例
如,图像数据在相邻像素间具有高度相关性,其差值分布接近拉普拉斯分
布,标准差远小于原始图像的标准差,因此,对差值信号进行量化编码所
需的比特数必然小于直接对原始图像逐点进行量化编码所需要的比特数,
从而达到了数据压缩的目的。
量化器通过分层将映射变换后连续的模拟量离散化,以利于数字处
理。根据样本取值范围分层的均匀与否,量化可分为均匀(线性)量化和非
均匀(非线性)量化。另外,如果量化是对映射变换后的数据逐个进行,则
又称为标量量化;若是成组进行,则称为矢量量化。量化引入误差,并且
在重建图像时不可恢复。但由于人眼的视觉特性允许重建图像有一定的失
真,从而使得能够保持一定重建图像质量的量化成为可能。如何充分利用
人眼的视觉特性,通过量化消除图像的视觉冗余度,是量化器设计的关键
问题。
- XIII -
编码器通常为熵编码器,其目的在于寻找一种编码方法,最大限度地
去除量化后数据的符号冗余度,输出最终的二进制码字。
编码技术的理论基础是Shannon的信息理论,即无干扰编码理论和率
失真编码理论
[7]
。无干扰编码理论表明:在无干扰的条件下,总存在一种
无失真编码,使输出码的平均比特长度与信源熵任意地接近。无失真编码
统称为熵编码,目前主要有Huffman编码、算术编码、LZW编码及游程
编码。率失真理论指出:对失真D,存在一个率失真函数R (D),总可以找
到一种编码,使平均码长达到R (D)。编码方案就是在这个基础上建立
的。
2.4 本章小结
图像压缩编码技术分为现代图像编码技术和经典图像编码技术,编码
技术的理论基础是无干扰编码理论和率失真编码理论。块截断编码技术是
一种有效、快速的经典图像编码技术。
- XIV -
第3章 块截断编码原理
3.1块截断编码概述
块截断编码是一种有效的、快速的有损图像压缩方法。与矢量量化和
变换编码相比,块截断编码更加容易实现。因为它具有运算量低,所需存
贮量小,简单、快速的低复杂度实现算法,以及良好的抗信道干扰特性等
优点,所以长期以来在实时图像传输领域中一直受到人们的重视。实质上
块截断编码是一个1比特自适应矩保持(Moment-preserving quantizer)量化
器,它能够保持信号样本的一阶矩和二阶矩,使译码图像在一定程度上保
持了原图像的局部统计特性。块截断编码最早由和ll
于1979年提出,该算法保持图像的块均值和图像的块标准方差不变。后
来,在1984年,Lema和Mitchell提出了一种块截断编码的简单快速的改
进方法,即保持绝对值中心矩不变的块截断编码算法(Absolute
MomentBTC,AMBTC)
[8]
。然而标准块截断编码算法和绝对矩块截断编码算
法所能达到的比特率均为2比特/像素,同时其压缩比也不高。因此,为了
进一步提高压缩比、减少比特率,并提高重建图像的质量随后又陆续出现
了许多关于块截断编码的改进算法和自适应的或混合的块截断编码方案。
例如,用中值滤波器,矢量量化,插值或预测等方法来对输出量化器的数
据进行编码。然而,压缩比的增加,比特率的减少都是以重建图像失真度
的增大或算法复杂度的增加为代价的。
3.2 块截断编码基本原理
在标准的块截断编码中,将图像分段成为n×n无重叠图像块,4×4为
典型块,并为各数据块而单独设计的2电平(1bit)量化器。量化门限和二个
重建电平随一个图像块的局部统计特征而变化,因此该编码实际上是一个
局部二进制处理过程,这种数据块的表达方式是由一个n×n比特映像所组
成,该n×nbit代表了有关各像素的重建电平和确定两个重建电平的附加信
息,而译码是个简单的处理过程,它在作为每比特映像的各像素位置,选
定一个合适的重建值而完成译码。
标准块截断编码基本方框图,见图3-1。
当一幅灰度图像被块截断编码压缩编码,它首先被分成nn像素的非
重叠的块,对每一个块而言,均值能被定算出,见式(3-1)。
1
x
nn
- XV -
x
i1j1
nn
ij
(3-1)
开始
灰色图像
图像分割成N*N不重叠块
对每一个块进行计算编码
二进制位图和一对量化水平
译码程序重构图像块
重建图像
结束
图3-1 标准块截断编码原理图
x
ij
表明在块坐标( i ,j )处的像素值 ,一种与图像块相同大小的二进制
位图BM被用于记录块截断编码压缩的输出位 ,见式(3-2)。
1,ifx
ij
x,
b
ij
0,otherwise,
(3-2)
在这里b
ij
代表BM的(i,j)位,G
1
和G
0
分别代表大于均值和小于均值
的两个数组,X
H
和X
L
被置为量化电平用来重建图像,见式(3-3) ,(3-
4) 。
- XVI -
X
H
x
N
H
'
(3-3)
(3-4)
N
L
此处X’和X”分别代表G
1
和G
0
组中的像素组,而N
H
和N
L
是X’和X”的数
目。
在译码程序中,根据二进制位图BM和两个量化电平X
H
和X
L
,近似
图像块能被重构。通过连接所有重构图像块来获得译码图像。重构规格被
定义如下,见式(3-5)。
X
L
x
''
X
H
,ifb
ij
1
X
ij
X
L
,otherwise
(3-5)
译码程序中,根据二进制位图BM和两个量化电平近似图像块能被重
构。通过连接所有重构图像块来获得译码图像。重构规格被定义如下:
10810296
1128779
12510483
13011799
44pixels
73
110
10081
means98
11077
95
111
44binary
0
1121128484
112848484
0
X112,X84
HL
1121128484
0
0
bitmapreconstructedpixels
3.3 典型块截断编码方法
不同的块截断编码算法计算门限t、量化电平a和b的方法不一样,
复杂程度也不一样,下面给出一些典型算法:
1.Delp和Mitchell最早提出的块截断算法 (DM- BTC):
取一幅灰度图像,首先将输入图像划分成不重叠的块,假设每个块X
一般由m
m个象素组成,m通常取4或8;然后,设置一个门限t,将X
中象素按其灰度大小分成高于和低于门限t的两组象素;用截断图P(i, j)表
示象素值的高低,即,见式(3-6)。
1,ifX(i.j)t
(3-6)
p
i,j
0,ifX(i,j)t
其中
X(i.j)
表示块X中位置
(i.j)
处的灰度值;最后,计算每个块的两个
灰度值a和b(a
b),当
p
i,j
= l时,象素X(i
,
j)被量化为b,否则量
化为a.在译码端,X的译码重建为Y,“见式(3-7)”。
- XVII -
Y(i,j)a(ba)P(i,j)
(3-7)
如果a和b分别用8比特编码(原始图象中每个象素的灰度值用8比特
表示),而截断图
P
共需
m
2
比特,那么总比特数目是:16+
m
2
,平均每个象
素1+16/
m
2
比特,当m=4时,可以算出压缩比为4:1。
则该算法的表达式,“见式(3-8)”。
tX(
(X(i,j))/N
aXsN
1
(t)/N
0
(t)
(3-8)
bXsN
0
(t)/N
1
(t)
其中,X表示X的均值或一阶矩,N为X中象素总数目,
N
0
(t)
是X中
象素值小于等于门限t
N
1
(t)NN
0
(t)
,
s
2
(X(i,j)X)
2
的象素数目,其中
/N
,它是X的二阶矩.该算法
的特点是保持信号X的一阶和二阶矩不变。
2.Udpikar和Raina提出的仅保持一阶矩的块截断算法(UR-BTC),
“见式(3-9)”。
tX
a
X(i,j)X(i,j)t
/
1X(i,j)t
(3-9)
b
X(i,j)X(i,j)t
/
1X(i,j)t
3.Lema和Mitehell提出的保持一阶矩和一阶绝对中心矩不变的块截
断编码算法 (LM-BTC),“见式(3-10)”。
tX
aXNs/2N
0
(t)
(3-10)
bXNs/2N
1
(t)
其中,
s
X(i,j)X
/N
,
X
,
N
0
(t)
和
N
1
(t)
含义同上。
这种快速的改进算法叫做绝对矩块截断编码(AMBTC)
[9]
,它预测块的高
平均值和低平均值。标准的块截断编码算法和绝对矩块截断编码算法的比
特率都是2比特/像素。形成重建图像。
通过以上(3-8)式可以看出,标准的块截断算法涉及到计算平方函数或
平方根函数,因此,硬件实现起来比较困难。而绝对矩块截断编码则可以
避免这两种运算。而绝对矩块截断编码则可以避免这两种运算。与块截断
编码一样,首先将数字图像划分成n
n个图像块。然后,图像块以以上
(3-10)形式进行量化,即保持图像块的均值和绝对值一阶中心矩不变。
算出块均值为:
tX(
(X(i,j))/N
- XVIII -
绝对值一阶中心矩为:
s
X(i,j)X
/N
两个重建值a和b分别为
aXNs/2N
0
(t)
bXNs/2N
1
(t)
最后对块中所有像素执行二电平量化形成一个比特平面,存储“0”
以代表不大于平均值的像素值,其余的像素值由“1”代表。在解码阶
段,将a分配给位平面中的“0”,b分配给“1”,形成重建图像。
由此可以看出,与块截断编码相比,绝对矩块截断编码有以下三个优
点
[10]
:
(1) 编码端的计算复杂度大大降低。
(2) 解码端的处理时间大大减少。
(3) 绝对矩块截断编码的均方误差比块截断编码要小。
作为一个绝对矩块截断编码的例子,考虑一个4×4像素块:
6
97122144147
X
8990135145
859299120
现在来设计量化器,置其门限为整个块的均值X,两个重建电平为a、b,
并等于由门限分成两段的各段均值,由上矩阵知,
X123.0
(这里取阵中
全部元素的算术平均值),以此均值作为门限,则比特映像为:
1111
0011
B
0011
0000
B中的1表示实际像素值比门限值大的情况,而0表示低于门限值。然后
计算各段均值,其结果取最靠近它的整数,则可求得两个重建值分别为,
a=99和b=147.
这二值随同比特映像一起发送,且重建块为
7
9999147147
ˆ
X
9999147147
99999999
如果假定重建电平各由8bit表示,且在该比特映像上无附加的信源编
- XIX -
码,总比特率为:
(8816)162.0
比特像素
。
3.4 本章小结
块截断编码有两种经典的方法:标准的块截断编码和改进的块截断编
码即绝对矩块截断编码。标准的块截断编码需要计算子块的均值和方差,
绝对矩块截断编码只需要计算子块的均值,大大提高了运算速率。
- XX -
第4章 图像压缩实验
4.1 压缩评价准则
图像质量评价在图像处理中非常重要,主要体现在:在图像质量控制
系统中监控图像质量;在图像处理系统中作为评价系统优劣的依据;植入
图像处理系统中以优化算法和设置参数
[11]
。因为人的视觉系统才是图像系
统的最后终端,所以人的视觉做出的质量评价应是最佳评价。但是人类视
觉系统(HVS)本身就是一个结构复杂、性能十分优越的图像系统,人们对
此研究的时间并不长,虽然取得了不少有意义的成果,但在实际应用中还
有许多问题。为了评价数据压缩性能,人们引入保真度准则来度量编码恢
复的信号与原始信号之间存在偏差。在图像压缩性能评价中,常用的准则
有客观保真度与主观保真度。
1.客观保真度
客观评价
[12]
主要采用峰值信噪比(PSNR)和均方误差(MSE)这两种方法,
虽然简单实用,但也有许多缺点,因为它们几乎没有考虑人类视觉特性。
(1) 均方误差(MSE)
ˆ
(m,n)
表示解压图像,
f(m,n)
与令
f(m,n)
表示原始图像,
f
“见式(4-1)”。
f
ˆ
(m,n)
之间的偏差,
ˆ
(m,n)
(4-1)
e(m,n)f(m,n)f
假定两幅图像的大小为M
N,它们之间均方根误差e
ms
,见式(4-
2)。
2
1
ˆ
(m,n)
e
ms
f(m,n)f
(4-2)
MN
m1n1
可以采用均方根误差e
ms
作为客观保真度,进行图像压缩性能评价。
数据压缩的性能评价应与压缩比CR结合起来考虑。压缩比定义为表示原
始数据所需的比特数与压缩编码后所需的比特数之比,即
MN
1
2
表示原始数据所需的比特数
压缩编码后所需的比特数
在相同的压缩比之下,均方根误差
e
ms
越小,性能越好。反过来,在
相同的均方根误差e
ms
下,压缩比越大,性能越好。
(2) 峰值信噪比(PSNR),见式(4-3), (4-4)。
CR
- XXI -
2
MN
f(m,n)e
f
m1n1
SNR10lg
MN
(4-3)
2
ˆ
(m,n)
f(m,n)f
m1n1
255255
PSNR10lg
(4-4)
MN
2
ˆ
(m,n)
1
f(m,n)f
MN
m1n1
式中,SNR与PSNR的单位为分贝(dB);
e
f
为
f(m,n)
的均值,见式(4-
5)。
1
MN
e
f
f(m,n)
(4-5)
MN
m1n1
在相同的压缩比下,信噪比SNR或峰值信噪比
[13]
PSNR越大,性能越
好。反过来,在相同的信噪比SNR或峰值信噪比PSNR下,压缩比越
大,性能越好。
2.主观保真度
目前的图像压缩编码技术中,人们已越来越注意研究结合人眼的视觉
特性进行图像压缩的方法和技术,而且已成为图像压缩编码技术的发展方
向。主观评价是指人对图像质量的主观感觉。因为解压图像是给人看的,
从而在图像压缩性能评价中,主观评价往往更合适、更重要。
主观评价标准基于人眼视觉系统(HVS)
[14]
,主要采用平均评价分数
MOS(MeanOpinion Score)或多维计分
[15]
等方法进行测试,即组织一群足够
多的实验人员,通过观察来评定图像的质量,观察者给判定图像打上一定
的质量等级比较损伤程度给予图像进行比较等方法,根据不同的质量打上
5级、6级或7级的评分制,最后用平均的办法得到图像的分数,这样的
评分虽然在实际应用中不仅速度慢,费用高,而且存在许多局限,诸如观
察者的选取,实验条件的确定等,但比较符合实际。目前,国际的标准都
是采用主观评价标准。
4.2 块截断编码图像压缩实验
4.2.1 实验步骤
在块截断编码中,通常将图像分成n×n无重叠像素块,并为各数据块单
独设计2电平(1 bit)量化器
[16]
。量化门限和2个重建电平随一个图块的局
部统计特性而变化,因此该编码实际上是一个局部二进制处理过程。译码是
简单的逆处理过程,它为比特映像各像素位置选定一个合适的重建值而完成
- XXII -
译码。块截断编码的基本原理图,见图4-1。
源图像
发送装置
分段nn
非重叠子块
为各子块计算量化门
限和重建电平
编码并传送
重建电平
信道
各子块量化像素形成
nbit映像
编码并传送
比特映
像
信道
译码比特映像 译码重建电平
译码重建子
图块
接受装置
nn组合块
重建电平
图4-1 块截断编码基本原理图
- XXIII -
根据第三章的基本原理,我们给出块截断编码压缩的实例
[17]
,见图4-
2。
1081029673
1100
11211284
112877981
1000
1128484
X112,X84
mean98
HL
1251048377
1100
11211284
1301179995
1110
112112112
4
4
像素
4
4
二进制位图
重建像素
图4-2 块截断编码压缩实例
84
84
84
84
在图4-2显示了块截断编码压缩方法的实例,假定使用块截断编码的
块大小是4
4的像素,块X的均值是98,两个重构的值,X
H
和X
L
分别是
112和84,在BM中的比特位置,“1”表明图像块的反映向素值比98还
大,否则,该比特位置“0”,根据比特位和X
H
和X
L
的值,近似图像块能
很容易被重构。
此外,块截断编码压缩方法也能直接应用于彩色图像
[18]
,因为一幅彩
色图像的每个像素包含三元素(RGB)用块截断编码将一幅彩色图像的输出
压缩后将获得三个二进制位图以及分别给RGB分配三对量化电平。
4.2.2 实验结果及分析
为测试标准的块截断编码算法的性能并与绝对矩块截断编码算法比较,
本文对这些算法进行仿真实验以测试这些算法的PSNR和MSE。在实验中
采用三幅图象,‘Lena’,‘Landscape’和‘Photographer’图像,它们的大小分别为
512×512、256×256、256×256,分辨率为8比特/像素。每幅图象都被分成
若干块大小为4×4的块。
下面我们分别给出用标准算法和改进后算法的实验结果:
1.原始算法压缩后的图片见图4-3中的a,b,c三幅图所示:
(
a) lena图像
(
b) landscape图像
- XXIV -
(
c) Photographer图像
图4-3 原是算法压缩图片
2.绝对矩块截断编码压缩后的图像见图4-4中的d,e,f三幅图所示:
(
d) Lena 图像
(
e) Landscape图像
(
f) Photographer图像
图4-4 改进算法压缩图像
原始BTC算法的性能指标,见表(4-1)。
- XXV -
图像
Lena
Landscape
Photographer
表4-1 原始的块截断编码 数据
PSNR
27.21
26.51
29.16
MSE
123.69
145.20
78.90
改进的BTC算法的性能指标,见表(4-2)。
图像
Lena
Landscape
Photographer
表4-2 改进的块截断编码 数据
PSNR
31.23
30.67
32.08
MSE
119.67
141.19
75.87
实验结果分析:
从视觉效果上来看,经过标准的块截断编码算法压缩过的图片具有明
显的模糊边缘,然而经过绝对矩块截断编码算法压缩过的图片比较好的保
留了图片的边缘,图片整体较平滑,图像质量比原始的块截断编码算法处
理过的图像质量要高。
实验在相同的压缩比下进行,而且绝对矩块截断编码算法的PSNR数
值普遍在31左右,明显高于标准的块截断编码算法的数值。在相同的压
缩比下,峰值信噪比越高,说明该算法的性能越好;再来看实验得出的均
方误差即MSE。通过标准的块截断编码算法得出的MSE数值均大于绝对
矩块截断编码算法得到的数值,在相同的压缩比下,均方误差MSE值越
小,性能越好。综合这些数据,我们明显可以得到一个结论,那就是改进
的绝对矩块截断编码的性能要高于标准的块截断编码的性能。
对于实验中选取的三幅图像,Lena图像的像素比其他两幅图像的像素
都要高。下面我们先来比较Lena图像和Landscape这两幅图像的仿真结
果。
Lena图像经过处理后,图片较原始图像差别不大,图像比较清晰。然
而Landscape图像较原始图像边缘失真较明显,压缩后的图像不太平滑。
经过原始的块截断编码处理Lena图像得到的PSNR为27.21比Landscape
图像得到的26.51要高,这说明在块截断编码对图像进行压缩时,像素高
的图像压缩的性能较像素低的要好。
下面我们再来比较Landscape和Photographer这两幅图像:
对于Landscape和Photographer这两幅图像,虽然他们的像素一样,
经过压缩处理后的峰值信噪比也基本上一致,但是在经过块截断算法压缩
后他们的MSE数值差距很大,这说明同种像素下的图像在同意条件下进
行压缩时,作为评价性能能指标的MSE要比PSNR敏感。
综上所述,我们可以得到以下结论:
- XXVI -
标准的块截断编码压缩后的图像质量比较满意,运算过程比较快速,
图像的性能也不错。绝对矩块截断编码在处理图像时,使得图像的边缘更
加清晰,获得更高的图像质量,而且性能指标明显要比原始的块截断算法
要好,运算也更加快速。
4.3
本章小结
标准的块截断编码算法与绝对矩块截断编码算法相比,绝对矩块截断
编码有较高的图像质量、较低的均方误差值、较高的峰值信噪比值,这些
结论证明,绝对矩块截断编码算法性能能比标准的块截断编码算法好。
- XXVII -
结论
随着信息处理技术的飞速发展,图像越来越成为传递信息的主要载
体。然而数字图像的数据量又是非常巨大的,所以为了使得图像存储和图
像传输得以实现,图像压缩技术是非常必要的,同时数据传输带宽以及计
算机的处理速度也在另一方面限制了图像数据的传输,所以图像压缩技术
在当今越来越成为人们关注的焦点。
本论文首先介绍了当今流行的图像压缩技术,其中重点分析研究了块
截断图像编码算法,对两种典型的块截断算法通过实验进行了实现。通过
以上工作得到的结论如下:
1.标准的块截断编码,预测块平均和块标准偏差,算法比较容易简
单,操作比较迅速,实时性强,图像质量比较高,但是由于计算中涉及到
计算平方函数或平方根函数,因此,硬件实现起来比较困难。绝对矩块截
断算法, 是改进的块截断编码,它预测块的高平均值和低平均值,它将块
中像素值的均值作为阈值来使重建图像MSE最小化,该算法较原来的块
截断编码算法比较,有以下三种优点:首先,编码端的计算复杂度大大降
低;其次,解码端的处理时间大大减少;再次,绝对矩块截断编码的均方
误差比原始的块截断编码要小。
2.对lena,landspace和photographer三幅图像进行实验,从图像输
出的结果我们可以看到,经过标准的块截断编码压缩后的图像质量没有绝
对矩块截断编码压缩的图像质量好,前者图像边缘出现了较明显的方块失
真,后者图像边缘比较平滑;标准的块截断算法的均方误差值依次是
123.69、145.20、78.90;绝对矩块截断编码算法的均方误差值为
119.47,141.19,75.87标准块截断编码的峰值信噪比值是27.21,26.51,29.16;
绝对矩块截断编码算法的峰值信噪比值是31.23,30.67,32.08,明显看出,
在相同的压缩比条件下标准块截断算法的均方误差值比绝对矩块截断编码
的要大,峰值信噪比值要小,这些结论都证明,绝对矩块截断编码性能较
高。
目前本人只对灰度图形处理进行了研究,今后准备对彩色图像处理进
行学习探讨。
- XXVIII -
参考文献
1. 田青. 图像压缩技术[J]. 警察技术,2002,(1):30-31.
2. 张海燕,王东木等. 图像压缩技术[J] . 系统仿真学报,2002,
14(7):831-835.
3. 周宁,汤晓军, 徐维朴. JPEG2000图像压缩标准及其关键算法[J] .
现代电子技术, 2002,(12):1-5.
4. 吴永辉, 俞建新.JPEG2000图像压缩算法概述及网络应用前景[J] .计
算机工程,2003,29(3):7-10.
5. 章民立,徐孟侠. 一种简单的自适应方块图像编码.通信学报,1985,
6(3):67-70.
6. 薛向阳,吴立德.改进的块截断图象编码算法[J] .电子学报,
1997,.25(5):102-105.
7. E. J. Delp, O. R. Mitchell. Image compression using block truncation
coding. IEEE Trans Commun, 1979, 27: 1335-1342.
8. ,. Optimisation of multi-level block truncation coding.
Signal Processing:Image Communication . 2001,(16): 445-459.
9. 张基宏,王晖.一种自适应图像压缩编码算法.华南理工大学学报,
1998,(4):103-105.
10. 吕梅蕾,郑怡文.一种有效的基于中值滤波的BTC图像压缩编码算法
[J] .浙江工业大学学报,2003,31(4):382-386.
11. 袁明. 基于子带块截断的图像压缩编码算法研究.西安电子科技大
学.2006.
12. 王业奎,涂国防.基于块截断编码和运动补偿软件视频编码算法.电子
学报,2001.
13. Zheng-Ming Lu. Efficient BTC image coding algorithms with median
filtering. Journal of Harbin Institute of Technology.2000.
14. 徐润生,陈佩,张卫东,许晓鸣.基于矢量量化的高效BTC图像编码
算法.测控技术,2001,(5):187-193.
15. LU Zhe-ming. An efficient BTC image compression algorithm. Journal of
Shanghai Jiaotong University.2000
16. 邵菲,周辉,朱仁峰.静态图像自适应编码的一种实现方法.装备指挥
技术学院,2004,28(2):56-58.
17. 张宗平,刘贵忠.基于小波的视频图像压缩研究进展[J] .电子学报,
- XXIX -
2002, 30(6):883-889.
18. 朱仁峰,周辉.自适应块截短编码的一种实现方法[J] .装备指挥技学院
学报学报,2002,13(6):88-92.
- XXX -
致谢
感谢我的导师于晓洋教授,他们严谨细致、一丝不苟的作风一直是我
工作、学习中的榜样;他们循循善诱的教导和不拘一格的思路给予我无尽
的启迪。
在论文完成过程中感谢吴海滨老师和贾佳莹学姐给予的帮助。
感谢我的室友们,从遥远的家来到这个陌生的城市里,是你们和我共
同维系着彼此之间姐妹般的感情,维系着寝室那份家的融洽。四年了,仿
佛就在昨天。四年里,我们没有红过脸,没有吵过嘴,没有发生上大学前
所担心的任何不开心的事情。只是今后大家就难得再聚在一起吃每年元旦
那顿饭了吧,没关系,各奔前程,大家珍重。我们在一起的日子,我会记
一辈子的。希望去往工大的青连和倩倩能够继续努力,留守理工的明研天
天开心,奔赴首都的耿燕有个更加美好的前程。
感谢我的爸爸妈妈,焉得谖草,言树之背,养育之恩,无以回报,你
们永远健康快乐是我最大的心愿。
在论文即将完成之际,我的心情无法平静,从开始进入课题到论文的
顺利完成,有多少可敬的师长、同学、朋友给了我无言的帮助,在这里请
接受我诚挚的谢意!
- XXXI -
附录A
- XXXII -
- XXXIII -
- XXXIV -
- XXXV -
- XXXVI -
- XXXVII -
- XXXVIII -
- XXXIX -
- XL -
- XLI -
- XLII -
- XLIII -
- XLIV -
- XLV -
- XLVI -
- XLVII -
- XLVIII -
- XLIX -
- L -
- LI -
- LII -
- LIII -
- LIV -
附录B
基于块截断编码的彩色图像无损数据隐藏
本论文中,我们提出一种新颖的,可逆的图像处理方法,这种方法能
在提取被嵌入的秘密信息后,有效的重构原始图像。这种可逆隐藏方法的
目的使用块截断编码来压缩彩色图像。通常地,被块截断编码压缩后的每
一个彩色图像块都需要找到一种近似的最佳通用位图来代替原始的三个位
图。接着秘密信息被嵌入到通用的位图中,每个块的量化电平使用边缘匹
配的特性和量化电平的顺序来达到可逆性。实验结果证明,所提出的方法
对于块截断编码方法所压缩的彩色图像是实际可应用的。同时,一般而
言,在每一个块截断编码的编码块中平均能嵌入多于三位的比特位。
1.BTC——块截断编码
由于稳定的压缩率和较低的算法成本,BTC成为流行的有损耗图像压
缩技术之一。不像使用在VQ中的电报密码本,BTC在编译码程序中,从
不要求任何的辅助信息。另外,BTC压缩的图像通常能维持可视的视觉质
量,同时通过使用其他无损失的压缩方法。输出信号能进一步被压缩。
当一幅灰度图像被BTC压缩编码后,它首先被分成n×n像素的非重
叠的块,对每一个块而言,均值
x
能被下式定算出:
1
nn
x
(1)
x
ij
n*n
i1j1
在这里
x
ij
表明在块坐标(i,j)处的像素值,然后,在块中所有像素都被
分成两组:大于,小于或等于均值
x
,分别作为G
1
和G
0
,一种与图像块
相同大小的二进制位图BM被用于记录BTC压缩的输出位。
如果图像块的通信像素值比X大同时被分类作为组G
1
,否则,被置
0,位图可用下述规则来产生
1,ifx
ij
x,
b
ij
0,otherwise,
(2)
在这里b
ij
代表BM的(i , j) 位。下一步,两个均值G
1
和G
0
,X
H
和X
L
,被置为量化电平被用来重建图像,按以下定义:
x
'
X
H
(3)
N
H
- LV -
X
L
x
N
L
''
(4)
此处x’和x”分别代表G
1
和G
0
中的像素组,而N
H
和N
L
是x’和x”的
数目。因此,一种灰度图像块被分解为一种二进制位图BM及两个量化电
平,X
H
和X
L
,然而,在特殊的情况下,当BM中所有的值都是均等的,
在BM中所有bit位都为0。
在译码程序中,根据二进制位图BM和两个量化电平X
H
和X
L
,近似
图像块能被重构。通过连接所有重构图像块来获得译码图像。重构规格被
定义如下:
X
ij
^
X,if1
H
b
ij
(5)
X
L
,otherwise
当前译码快的位置(i,j)处重构像素值。说明,如果位图中的比特都是
0,那么伴随均值能被直接用来重构X
ij
.
在图1中显示了BTC压缩方法的实例,假定使用BTC的块大小是
4×4的像素,块X的均值是98,两个重构的值,X
H
和X
L
分别是112和
84,在BM中的比特位置,“ 1”表明图像块的反映向素值比98还大,否
则,该比特位置“0”,根据比特位和X
H
和X
L
的值,近似图像块能很容易
被重构。
BTC压缩方法也能直接应用于彩色图像,因为一幅彩色图像的每个像
素包含三元素—RGB—用BTC将一幅彩色图像的输出压缩后将获得三个
二进制位图以及分别给RGB分配三对量化电平。
2.遗传算法(GA)
美国密歇根大学d1975年首次提出基于自然基因演变的遗传算
法。为了发现一种近似理想的解决方案,它作为一种完全的耗时研究的替
代算法成为一种直接的随机研究技术。直到现在,遗传算法被广泛应用于
多种领域例如目标识别或其他相似的问题,在传统遗传算法中,一种译码
的二进制序列表示的每一种方案被称作染色体,同时在二进制序列中的每
一个元素被称作基因。
对于染色体而言,使用二进制描述的遗传算法的概念描述如下,一组
确定的染色体最初产生于初代种群。通过三种操作——选择,组合交叉和
变异——通常较好的染色体被保存复制给下一代,而较差的则在竞争中被
淘汰。通过这种方式,较好的基因被维持下来,结果是同时产生了更好的
染色体。因此,选择、组合交叉和变异是自然进化的三个主要规律。同
时,它们被描述如下所示:
- LVI -
一种典型的二进制遗传算法完整的流程图如图所示。在图2中,最终
的条件通常意味着或者发现了某种解决方法,该方法满足预定的门限值或
者可满足迭代的预值。在遗传算法操作完成之后,可获得近似理想的解决
方法。
3. 实验讨论
在这部分,我们给出了实验结果来证明所提出隐藏方法的视觉质量和
嵌入容量。在实验中使用了不同尺寸的六个标准的彩色图像
(lena,F16,pepper,Tiffany,Sailboat,and Baboon),在块截断编码压缩中使用的
块尺寸设置为4×4像素。嵌入的秘密信息包含一个随机的二进制数据流,
这个数据流由预设的一个随机数字发生器产生。
3.1 实验结果
图3-1给出了由传统块截断编码技术压缩的图像结果,它包含三个二
进制位图,分别为R,G,B。信噪比PSNR用来估计BTC压缩图像的视觉质
量,均方误差MSE(mean-square-error)定义如下.
(6)
(7)
在等式(7)中α(i,j)β(i,j)分别表示原始图像和BTC重构图像中位置(ij)的像素
值,w和h表示图像的宽和高。图4.1给出的BTC压缩图像的PSNR在表
4.1中列出。在此表中,我们能明显的看到前五个图像的信噪比高于最后
一个,因为前五个图像比最后一个平滑。
在我们的方法中,为了减少在传统BTC方法中使用的二进制位图,
应用了遗传算法获得最优的通用二进制位图,此外,每个通用二进制位图
都是基于人眼视觉系统产生的。使用通用二进制位图的BTC压缩图像结
果如图3.2。
在3.2中的图像与3.1中的图像很相似,人眼几乎不能分辨。图4.2中
不同尺寸图像的信噪比在表3.2中列出。从表3.1和3.2,我们得出,在每
个彩图中使用一个通用二进制位图代替三个二进制位图,PSNR平均只减
少了2dB。
不同尺寸彩色图像的隐藏结果细节,总结如表3-3。在表3-3中,“原
始文件”表示原始的BTC压缩图像文件尺寸,“stego file”表示嵌入秘密信
息后的文件尺寸。the “number of three-secret-bits patterns”表示能够隐藏三
维信息位的块的个数,the “number of four-secret-bits patterns”,表示能够隐
- LVII -
藏四位信息位的块的个数,“ embedding capacity”表示隐藏信息位的总数,
“embedding percentage”表示隐藏信息量和原始图像的比值。表3-3说明,
加密文件的大小和隐藏能力都与图像的复杂程度有关,平滑的块通常隐藏
更多的四位信息位。
结论是,平滑的图像Pepper具有最多的可隐藏四位信息位的可替换块
和最少的可隐藏三位信息位的不可替换块。但是一个有趣的现象是,
Tiffany隐藏能力最小,因为它具有最多的等像素值块,所以可隐藏信息的
块减少。我们同时得出,除了Tiffany外,较大的图像尺寸能够获得较大
的隐藏率。
我们的隐藏方法并没有降低图像的质量。换句话说,提取秘密信息后
的重构图像的信噪比与原始BTC压缩图像的信噪比相等。因此,成功的
达到了可逆隐藏的目的。
提出的方法也可以应用于不同尺寸的简单图像,如图3.3.这些图像比
前面的图像具有更多的一致区域。图3-3的信噪比和隐藏结果分别如表3-
4和3-5。结果表明,简单图像的隐藏量只是略有降低。
3.2
.
讨论
提出的方法使用了两个量化水平的顺序而不是直接替换载体最低有效
位来暗示机密数据,最低有效位隐藏方法也许不足以抵抗密信攻击,但是
还没有研究表明重排序方法具有这样的问题。因为在原始BTC压缩方法
中两个量化水平的顺序就不固定,它们的顺序在隐藏BTC编码中也不固
定。恶意拦截者仍然很难检测到秘密信息的存在。为了进一步加强秘密信
息的安全性,一个普遍的方法是使用一些加密方法,例如DEC和RAS来
加密密信。
BTC压缩方法的价值在于很高效。表3.6比较了BTC和DCT 的压缩
能力。DCT方法是一种原始方法(不使用任何优化操作来提高压缩时间)。
从表中我们得出尽管BTC图像质量稍低,但是编码时间很快。由于高效
性和简单的结构,BTC广泛应用于图像传输,图像索引,边缘检测,图像
恢复,和其他实时应用。图3.4给出了未压缩和压缩的图像比较。我们得
出尽管BTC压缩图像的信噪比较低,但是人眼几乎不能分辨。这说明,
BTC具有有效维持图像质量的性质,并且具有稳定的压缩率和少的计算
量。
我们也和Tian的方法做了比较,Tian的原始方法是应用于非压缩图
像,也可以直接应用于BTC压缩图像。
在Tian的方法中,一个秘密信息可被嵌入到一个可扩展的和可变换的
一对字节中。然而,可变换对对于隐藏量没有提高,因为它们需要一个额
外的二进制数据流来记录原始比特位。因此,我们只能把秘密信息嵌入到
- LVIII -


发布评论