2024年6月2日发(作者:)

精品实验项目 字符识别预处理的设计

与实现

专 业:电子信息工程

* 名: * *

学 号:**********

指导老师:***

1

目录

一、 实验类型:设计性实验 ................................................................................................... 3

二、 实验目的 ........................................................................................................................... 3

三、 实验设备: 扫描仪、安装有MATLAB软件的计算机 ................................................... 3

四、 实验内容及原理 ............................................................................................................... 3

(1)字符图像的获取 ............................................................................................................. 3

(2)字符图像预处理 ............................................................................................................. 3

(3)字符图像分割 ................................................................................................................. 3

(4)函数的作用 ..................................................................................................................... 4

五、 实验步骤 ........................................................................................................................... 8

1.载入车牌图像: ................................................................................................................... 8

2.将彩图转换为灰度图并绘制直方图: ............................................................................... 9

3. 用roberts算子进行边缘检测: ................................................................................... 10

4.图像实施腐蚀操作: ......................................................................................................... 10

5.平滑图像 ............................................................................................................................. 11

6. 删除二值图像的小对象 ................................................................................................... 12

7.车牌定位 ............................................................................................................................. 12

8.字符分割与识别 ................................................................................................................. 14

9.车牌识别: ......................................................................................................................... 20

六、 思考题............................................................................................................................. 27

2

一、 实验类型

设计性实验

二、 实验目的

1. 掌握图像的获取、预处理和分割的原理及MATLAB实现方法。

2. 掌握使用扫描仪和计算机获取数字图像的方法,理解扫描仪的原理。

3. 自学一种字符图像的分割算法并用MATLAB编程实现该算法。

三、 实验设备

扫描仪、安装有MATLAB软件的计算机

四、 实验内容及原理

(1)字符图像的获取

用扫描仪获取图像是字符图像处理常用的数字化过程的方法之一。以办公设备中常用的

台式扫描仪为例,其主要性能指标有x、y方向的分辨率、色彩分辨率(色彩位数)、扫描幅

面和接口方式等,这些指标都可以从扫描仪的说明手册中获得。分辨率的单位是dpi(Dot Per

Inch),意思是每英寸的像素点数。

扫描仪工作时,首先由可移动带状光源将光线照在欲输入的图稿上,并沿y方向扫描稿

件,产生表示图像特征的反射光或透射光。照射到原稿上的光线经反射后穿过一个很窄的缝

隙,形成沿x方向的光带,经光学系统采集和过滤成RGB三色光带分别照射到RGB分量

的CCD上,CCD将光信号转换为模拟电信号。内部电路的A/D变换器将模拟电信号转变

为数字电子信号输送给计算机。将稿件全部扫描一遍,一幅完整的图像就输入到计算机中去

了。

(2)字符图像预处理

根据扫描仪扫描的文档实际情况,有选择地用MATLAB编程实现字符图像倾斜校正、

滤波、灰度化、二值化和归一化等图像预处理。根据具体需要,还可进行图像的正交变换、

边缘提取、形态学和图像细化等操作。

(3)字符图像分割

通过查找资料,自学字符图像分割的常用算法,根据原始扫描图像的实际情况,设计一

种字符图像分割的方法并用MATLAB编程实现,并绘制流程图。

车辆

字符分割

图像采集

字符识别

图像预处理

输出车牌号码

车牌的定位

3

图1 流程图

(4)函数的作用

e

功能:对图像实现腐蚀操作,即膨胀操作的反操作。

用法:IM2 = imerode(IM,SE)

IM2 = imerode(IM,NHOOD)

IM2 = imerode(IM,SE,PACKOPT,M)

IM2 = imerode(...,PADOPT)

IM2 = imerode(IM,SE) 腐蚀灰度,二值,压缩二值图像IM,返回IM2。参数SE为由strel

函数返回的结构元素或者结构元素对象组。

IM2 = imerode(IM,NHOOD)腐蚀图像IM,这里NHOOD是定义结构元素邻域0和1的矩阵。

IM2 = imerode(...,PADOPT)指出输出图像的大小(是否与输入图像大小一致)。

te

功能:对图像实现膨胀操作。

用法:IM2 = imdilate(IM,SE)

IM2 = imdilate(IM,NHOOD)

IM2 = imdilate(IM,SE,PACKOPT)

IM2 = imdilate(...,PADOPT)

IM2 = imdilate(IM,SE) 膨胀灰度,二值,压缩二值图像IM,返回IM2。参数SE为由strel

函数返回的结构元素或者结构元素对象组。

IM2 = imdilate(IM,NHOOD)膨胀图像IM,这里NHOOD是定义结构元素邻域0和1的矩阵。

IM2 = imdilate(IM,SE,PACKOPT)定义IM是否是一个压缩的二值图像。

IM2 = imdilate(...,PADOPT)指出输出图像的大小。

4

功能:用于膨胀腐蚀及开闭运算等操作的结构元素对象(本论坛随即对膨胀腐蚀等操作进行

讲解)。

用法:SE = strel(shape,parameters)

创建由指定形状shape对应的结构元素。其中shape的种类有

‘arbitrary','pair','diamond','periodicline','disk','rectangle'

'line','square','octagon

参数parameters一般控制SE的大小。

BW = edge(I)

采用灰度或一个二值化图像I作为它的输入,并返回一个与I相同大小的二值化图像BW,

在函数检测到边缘的地方为1,其他地方为0。

BW = edge(I,'sobel') 自动选择阈值用Sobel算子进行边缘检测。

BW = edge(I,'sobel',thresh) 根据所指定的敏感度阈值thresh,用Sobel算子进行边缘

检测,它忽略了所有小于阈值的边缘。当thresh为空时,自动选择阈值。

BW = edge(I,'sobel',thresh,direction) 根据所指定的敏感度阈值thresh,在所指定的

方向direction上,用Sobel 算子进行边缘检测。Direction可取的字符串值为

horizontal(水平方向)、vertical(垂直方向)或both(两个方向)。

[BW,thresh] = edge(I,'sobel',...) 返回阈值

BW = edge(I,'prewitt') 自动选择阈值用prewitt算子进行边缘检测。

BW = edge(I,'prewitt',thresh) 根据所指定的敏感度阈值thresh,用prewitt算子进行

边缘检测,它忽略了所有小于阈值的边缘。当thresh为空时,自动选择阈值。

BW = edge(I,'prewitt',thresh,direction) 根据所指定的敏感度阈值thresh,在所指定

的方向direction上,用prewitt算子进行边缘检测。Direction可取的字符串值为

horizontal(水平方向)、vertical(垂直方向)或both(两个方向)默认方向为both。

BW = edge(I,'roberts') 自动选择阈值用roberts算子进行边缘检测。

BW = edge(I,'roberts',thresh) 根据所指定的敏感度阈值thresh,用Roberts算子进行

边缘检测,它忽略了所有小于阈值的边缘。当thresh为空时,自动选择阈值。

e

功能:对图像实现闭运算,闭运算也能平滑图像的轮廓,但与开运算相反,它一般融合窄的

缺口和细长的弯口,去掉小洞,填补轮廓上的缝隙。

5

用法:IM2 = imclose(IM,SE)

IM2 = imclose(IM,NHOOD)

用法和imopen相同。

功能:对图像实现开运算,开运算一般能平滑图像的轮廓,消弱狭窄的部分,去掉细的突出。

用法:IM2 = imopen(IM,SE)

IM2 = imopen(IM,NHOOD)

IM2 = imopen(IM,SE)用 结构元素SE实现灰度图像或二值图像的IM的形态开运算。SE可

以是单个结构元素对象或者结构元素对象数组。

IM2 = imopen(IM,NHOOD)用结构元素strel(NHOOD)执行开运算。

open

功能:删除小面积对象

格式:

BW2 = bwareaopen(BW,P,conn)

作用:

删除二值图像BW中面积小于P的对象,默认情况下conn使用8邻域。

和toc函数

这两个函数一般配合使用,tic表示计时的开始,toc表示计时的结束。

格式如:

tic

任意表达式

toc

t=toc

al

6

功能:用于建立预定义的滤波算子,其语法格式为:

h = fspecial(type)

h = fspecial(type,para)

其中type指定算子的类型,para指定相应的参数;

type的类型有:

1、'average'

averaging filter

为均值滤波,参数为hsize代表模板尺寸,默认值为【3,3】。

'disk'

circular averaging filter

为圆形区域均值滤波,参数为radius代表区域半径,默认值为5.

'gaussian'

Gaussian lowpass filter

为高斯低通滤波,有两个参数,hsize表示模板尺寸,默认值为【3 3】,sigma为滤波器的

标准值,单位为像素,默认值为0.5.

'prewitt'

Prewitt horizontal edge-emphasizing filter

用于边缘增强,大小为【3 3】,无参数

'sobel'

Sobel horizontal edge-emphasizing filter

用于边缘提取,无参数

9. filter2

J = filter2(h,I);使用指定的滤波器h对I进行滤波,结果保存在J中

函数功能:计算二值图像中对象的总面积。

调用格式:

total = bwarea(BW)

估算二值图像BW中对象的总面积。 返回的total是一个标量, 它的值大致地反映了和图

像中on像素的个数。由于对于不同像素类型, 度量标准不同, 因此结果可能并不十分精

7

确。BW可以是数值类型(整型、浮点型)或者逻辑类型。对于数值类型, 像素值不为0被

视为on。返回值total是double类型的。

功能:函数求和

sum(x,2)表示矩阵x的横向相加,求每行的和,结果是列向量。

而缺省的sum(x)就是竖向相加,求每列的和,结果是行向量。

A>0的结果是得到一个逻辑矩阵,大小跟原来的A一致,

A中大于零的元素的位置置为1,小于等于零的位置置为0。

所以横向求和以后,就是求A中每行大于零的元素个数。

12. round

功能:四舍五入

调用格式:Y = round(X)

在matlab中round也是一个四舍五入函数。

五、 实验步骤

1.载入车牌图像:

I=imread('');

figure(1),imshow(I);title('original image');%将车牌的原图显示出来,结果如下

8

2.将彩图转换为灰度图并绘制直方图:

I1=rgb2gray(I);%将彩图转换为灰度图

figure(2),subplot(1,2,1),imshow(I1);title('gray image');

figure(2),subplot(1,2,2),imhist(I1);title('灰度图直方图');%绘制灰度图的直方图

结果如下所示:

9

3. 用roberts算子进行边缘检测:

I2=edge(I1,'roberts',0.18,'both');%选择阈值0.18,用roberts算子进行边缘检测

figure(3),imshow(I2);title('roberts operator edge detection image');

结果如下:

4.图像实施腐蚀操作:

se=[1;1;1];

I3=imerode(I2,se);%对图像实施腐蚀操作,即膨胀的反操作

figure(4),imshow(I3);title('corrosion image');

10

5.平滑图像

se=strel('rectangle',[25,25]);%构造结构元素以正方形构造一个se

I4=imclose(I3,se);%

图像聚类、填充图像

figure(5),imshow(I4);title('smothing image');

结果如下所示:

11

6. 删除二值图像的小对象

I5=bwareaopen(I4,2000);%

去除聚团灰度值小于2000的部分

figure(6),imshow(I5);title('remove the small objects');

%用imshow函数显示滤波后图像

结果如下所示 :

7.车牌定位

[y,x,z]=size(I5);%返回I5各维的尺寸,存储在x,y,z中

myI=double(I5);%将I5转换成双精度

tic %tic表示计时的开始,toc表示计时的结束

Blue_y=zeros(y,1);%产生一个y*1的零阵

for i=1:y

for j=1:x

if(myI(i,j,1)==1)

%如果myI(i,j,1)即myI的图像中坐标为(i,j)的点值为1,即该点为车牌背景颜色蓝色

%则Blue_y(i,1)的值加1

Blue_y(i,1)= Blue_y(i,1)+1;%蓝色像素点统计

end

12

end

end

[temp MaxY]=max(Blue_y);%Y方向车牌区域确定

%temp为向量yellow_y的元素中的最大值,MaxY为该值的索引

PY1=MaxY;

while ((Blue_y(PY1,1)>=5)&&(PY1>1))

PY1=PY1-1;

end

PY2=MaxY;

while ((Blue_y(PY2,1)>=5)&&(PY2

PY2=PY2+1;

end

IY=I(PY1:PY2,:,:);

%行方向车牌区域确定

%%%%%% X方向 %%%%%%%%%

Blue_x=zeros(1,x);%进一步确定x方向的车牌区域

for j=1:x

for i=PY1:PY2

if(myI(i,j,1)==1)

Blue_x(1,j)= Blue_x(1,j)+1;

end

end

end

PX1=1;

while ((Blue_x(1,PX1)<3)&&(PX1

PX1=PX1+1;

end

PX2=x;

while ((Blue_x(1,PX2)<3)&&(PX2>PX1))

13

PX2=PX2-1;

end

PX1=PX1-1;%对车牌区域的校正

PX2=PX2+1;

dw=I(PY1:PY2-8,PX1:PX2,:);

t=toc;

figure(7),subplot(1,2,1),imshow(IY),title('Line direction areas');%行方向车牌区

域确定

figure(7),subplot(1,2,2),imshow(dw),title('positioning color images');%定位后

的车牌区域如下所示:

8.字符分割与识别

1) 车牌的进一步处理

对分割出的彩色车牌图像进行灰度转换、二值化、均值滤波、腐蚀膨胀以及字符分割以从车

牌图像中分离出组成车牌号码的单个字符图像,对分割出来的字符进行预处理(二值化、归

一化),然后分析提取,对分割出的字符图像进行识别给出文本形式的车牌号码。代码如下:

imwrite(dw,'');%将彩色车牌写入dw文件中

a=imread('');%读取车牌文件中的数据

14

b=rgb2gray(a);%将车牌图像转换为灰度图

imwrite(b,'gray licence ');%将灰度图像写入文件中

figure(8);subplot(3,2,1),imshow(b),title('车牌灰度图像')

g_max=double(max(max(b)));

g_min=double(min(min(b)));

T=round(g_max-(g_max-g_min)/3); % T 为二值化的阈值

[m,n]=size(b);

d=(double(b)>=T); % d:二值图像

imwrite(d,'binary licence ');

subplot(3,2,2),imshow(d),title('before filtering binary licence plate')

%均值滤波前

% 滤波

h=fspecial('average',3);

%建立预定义的滤波算子,average为均值滤波,模板的尺寸为3*3

d=im2bw(round(filter2(h,d)));%使用指定的滤波器h对h进行d即均值滤波

imwrite(d,'after average licence ');

subplot(3,2,3),imshow(d),title('after average licence plate')

% 某些图像进行操作

% 膨胀或腐蚀

% se=strel('square',3); % 使用一个3X3的正方形结果元素对象对创建的图像进行膨胀

% 'line'/'diamond'/'ball'...

se=eye(2); % eye(n) returns the n-by-n identity matrix 单位矩阵

[m,n]=size(d);%返回矩阵b的尺寸信息, 并存储在m,n中

if bwarea(d)/m/n>=0.365 %计算二值图像中对象的总面积与整个面积的比是否大于0.365

d=imerode(d,se);%如果大于0.365则图像进行腐蚀

elseif bwarea(d)/m/n<=0.235 %计算二值图像中对象的总面积与整个面积的比是否小于

0.235

d=imdilate(d,se);%如果小于则实现膨胀操作

end

imwrite(d,'expansion or corrosion the licence ');

15

subplot(3,2,4),imshow(d),title('expansion or corrosion the licence plate');

运行结果如下所示:

2) 字符分割

在汽车牌照自动识别过程中,字符分割有承前启后的作用。它在前期牌照定位的基础

上进行字符的分割,然后再利用分割的结果进行字符识别。字符识别的算法很多,因为车

牌字符间间隔较大,不会出现字符粘连情况,所以此处采用的方法为寻找连续有文字的块,

若长度大于某阈值,则认为该块有两个字符组成,需要分割。一般分割出来的字符要进行

进一步的处理,以满足下一步字符识别的需要。但是对于车牌的识别,并不需要太多的处

理就已经可以达到正确识别的目的。在此只进行了归一化处理,然后进行后期处理。

% 寻找连续有文字的块,若长度大于某阈值,则认为该块有两个字符组成,需要分割

%首先创建子函数qiege与getword,而后调用子程序,将车牌的字符分割开并且进行归一

化处理

d=qiege(d);

16

[m,n]=size(d);

subplot(3,2,5),imshow(d),title(n)

k1=1;k2=1;s=sum(d);j=1;

while j~=n

while s(j)==0

j=j+1;

end

k1=j;

while s(j)~=0 && j<=n-1

j=j+1;

end

k2=j-1;

if k2-k1>=round(n/6.5)

[val,num]=min(sum(d(:,[k1+5:k2-5])));

d(:,k1+num+5)=0; % 分割

end

end

% 再切割

d=qiege(d);

% 切割出 7 个字符

y1=10;y2=0.25;flag=0;word1=[];

while flag==0

[m,n]=size(d);

left=1;wide=0;

while sum(d(:,wide+1))~=0

wide=wide+1;

end

if wide

d(:,[1:wide])=0;

d=qiege(d);

17

else

temp=qiege(imcrop(d,[1 1 wide m]));

[m,n]=size(temp);

all=sum(sum(temp));

two_thirds=sum(sum(temp([round(m/3):2*round(m/3)],:)));

if two_thirds/all>y2

flag=1;word1=temp; % WORD 1

end

d(:,[1:wide])=0;d=qiege(d);

end

end

% 分割出第二个字符

[word2,d]=getword(d);

% 分割出第三个字符

[word3,d]=getword(d);

% 分割出第四个字符

[word4,d]=getword(d);

% 分割出第五个字符

[word5,d]=getword(d);

% 分割出第六个字符

[word6,d]=getword(d);

% 分割出第七个字符

[word7,d]=getword(d);

figure(9);

subplot(2,7,1),imshow(word1),title('1');

subplot(2,7,2),imshow(word2),title('2');

subplot(2,7,3),imshow(word3),title('3');

subplot(2,7,4),imshow(word4),title('4');

subplot(2,7,5),imshow(word5),title('5');

subplot(2,7,6),imshow(word6),title('6');

18

subplot(2,7,7),imshow(word7),title('7');

[m,n]=size(word1);

% 商用系统程序中归一化大小为 40*20,此处演示

word1=imresize(word1,[40 20]);

word2=imresize(word2,[40 20]);

word3=imresize(word3,[40 20]);

word4=imresize(word4,[40 20]);

word5=imresize(word5,[40 20]);

word6=imresize(word6,[40 20]);

word7=imresize(word7,[40 20]);

subplot(2,7,8),imshow(word1),title('1');

subplot(2,7,9),imshow(word2),title('2');

subplot(2,7,10),imshow(word3),title('3');

subplot(2,7,11),imshow(word4),title('4');

subplot(2,7,12),imshow(word5),title('5');

subplot(2,7,13),imshow(word6),title('6');

subplot(2,7,14),imshow(word7),title('7');

imwrite(word1,'');

imwrite(word2,'');

imwrite(word3,'');

imwrite(word4,'');

imwrite(word5,'');

imwrite(word6,'');

imwrite(word7,'');

运行结果如下:

19

9.车牌识别:

模板匹配是图象识别方法中最具代表性的基本方法之一,它是将从待识别的图象或图

象区域f(i,j)中提取的若干特征量与模板T(i,j)相应的特征量逐个进行比较,计算它们

之间规格化的互相关量,其中互相关量最大的一个就表示期间相似程度最高,可将图象

归于相应的类。也可以计算图象与模板特征量之间的距离,用最小距离法判定所属类。

此处采用相减的方法来求得字符与模板中哪一个字符最相似,然后找到相似度最大

的输出。汽车牌照的字符一般有七个,大部分车牌第一位是汉字,通常代表车辆所属省

份,紧接其后的为字母与数字。车牌字符识别与一般文字识别在于它的字符数有限,汉

字共约50多个,大写英文字母26个,数字10个。为了实验方便,结合本次设计所选汽

车牌照的特点,只建立了7个数字26个字母与10个数字的模板。其他模板设计的方法

与此相同。

首先取字符模板,接着依次取待识别字符与模板进行匹配,将其与模板字符相减,得

到的0越多那么就越匹配。把每一幅相减后的图的0值个数保存,即为识别出来的结果。

识别的流程图如下所示:

20

建立自动识别的代码表

读取分割出来的字

第一个字符与模板中

的汉字模板进行匹配

第二个字符与模板中

的字母模板进行匹配

后5个字符与模板中的字

母与数字模板进行匹配

待识别字符与模板字符相减,值越小相似度

越大,找到最小的一个即为匹配的最好的

识别完成,输出此模板对应值

源代码如下:

liccode=char(['0':'9' 'A':'Z' '苏豫陕鲁京辽浙']); %建立自动识别字符代码表

SubBw2=zeros(40,20);

l=1;

for I=1:7

ii=int2str(I);

t=imread([ii,'.jpg']);

SegBw2=imresize(t,[40 20],'nearest');

SegBw2=double(SegBw2)>20;

if l==1 %第一位汉字识别

kmin=37;

kmax=43;

elseif l==2 %第二位 A~Z 字母识别

kmin=11;

kmax=36;

else l>=3 %第三位以后是字母或数字识别

21

kmin=1;

kmax=36;

end

for k2=kmin:kmax

fname=strcat('字符模板',liccode(k2),'.jpg');

SamBw2 = imread(fname);

SamBw2=double(SamBw2)>1;

for i=1:40

for j=1:20

SubBw2(i,j)=SegBw2(i,j)-SamBw2(i,j);

end

end

% 以上相当于两幅图相减得到第三幅图

Dmax=0;

for k1=1:40

for l1=1:20

if ( SubBw2(k1,l1) > 0 | SubBw2(k1,l1) <0 )

Dmax=Dmax+1;

end

end

end

Error(k2)=Dmax;

end

Error1=Error(kmin:kmax);

MinError=min(Error1);

findc=find(Error1==MinError);

Code(l*2-1)=liccode(findc(1)+kmin-1);

Code(l*2)=' ';

22

l=l+1;

end

figure(10),imshow(dw),title (['车牌号码:', Code],'Color','b');

通过以上的方法,我对另外一幅图像进行了检测,也有较好的识别效果。下面是对另一幅车

牌照的检测,结果如下所示:

23

24

25

26

六、 思考题

1.扫描仪是图像信号输入设备。它对原稿进行光学扫描,然后将光学图像传送到光电转换器

27

中变为模拟电信号,又将模拟电信号变换成为数字电信号,最后通过计算机接口送至

计算机中。在扫描仪获取图像的过程中,有两个元件起到关键作用。一个是CCD,它光

信号转换成为电信号;另一个是A/D变换器,它将模拟电信号变为数字电信号。

2.在字符图像预处理中采用了字符图像倾斜校正、滤波、灰度化、二值化和归一化等图像预

处理方法。

3.字符分割的方法有python 、vb、javascript、asp :split

php是explode。

28