2024年3月17日发(作者:)

如何从图片中提取文字

如何从图片中提取文字2011-05-19 13:30

现在许多网站都有电子书下载,常见的格式有exe、chm、pdf等。为了保

护作者的权益,这些电子书可以看,但是其中的内容却不能进行复制,因为它

就像一幅图片一样。如果我们需要使用这些资料中的文本内容的话,是不是就

一定要重新输入一遍呢?当然不用这么麻烦。下面就为大家介绍将这些内容从资

料中提取出来的方法。

用SnagIt工具进行文字提取。

SnagIt是一款功能强大的图片捕捉工具,但是很多朋友可能不知道,它还

有文字捕捉的功能,能将文字从图片中提取出来。

SnagIt(屏幕捕捉程序)v8.1汉化绿色版:

SnagIt当前版本为7.02,大小为8903KB,下载地址可以在找到,汉化补

丁可以在找到。

启动SnagIt,选择菜单"输入/区域",选择菜单"工具/文字捕获",然后我

们打开要捕捉的文件窗口,按下捕捉快捷键,选定捕捉区域即可捕捉到文字。

在左侧选中"窗口文字"(如图),在左侧选择输入位置(比如屏幕、区域、窗口

等),输出位置(比如打印机、剪贴板、文件等)。设置完成后,.回到要捕捉文

字的文件窗口,按下"捕获"快捷键,即可将文字提取出来。

接着用相应工具重排文字。此时我们发现提取的文字可能会有很多空格或

段落错乱等现象,而且字号、字体等不合自己的心意。这时我们可以用熟悉的

WPS或Word软件进行重新编排。我们以WPSOffice2003为例看看如何对付提取

后文章的编排:用WPSOffice2003打开提取文章;然后选择"工具"菜单下的"文

字"/"段落重排",这时你会看到提取文章重新进行排版;接下来选择"工具"菜

单下的"文字"/"删除段首空格"命令,使得文章的每段参差不齐的行首空格被删

除;再选择"工具"菜单下的"文字"/"增加段首空格",文章变为正常的书写格式;

提取文章一般都留有空段,为删除这些空段,继续选择"工具"菜单下的"文字

"/"删除空段"命令,这时文章完全变为我们所要的形式;用你熟悉的界面任意

编辑文章吧。

用Office 2003提取图片中的文字

后,保存为.jpg格式

[图3]保存后的.jpg图片

图1、图2、图3是假设在浏览网页时,遇到含有文字的图片,利用腾讯

TT截图功能,在Photoshop粘贴生成.jpg文件;当然,也可以使用键盘上的

PrintScan键截图后,打开附件里的画图,进行粘贴生成.jpg文件。

2."尚书六号"的界面

3.导入需要提取的图片

[图5]点击"文件",选择"打开图象页"

[图6]选择刚才保存的并点击"打开"

[图7]"尚书六号"自动识别的三个选框

4.提取文字并保存文本

[图8]不修改默认设置,直接点击"识别"后,弹出的界面

[图9]将框内的文字选中,并复制到文本文件或Word文档进行个别错字修

Free-ORC

是一个非常好的免费在线服务,可以讲图片或者PDF中的文字提取出来,

支持的文件有PDF,JPG,GIF,TIFF,BMP or PNG,可以识别出6种文字:

English,German,french,Italian,Dutch and Spanish(英语,德语,法语,荷

兰语和西班牙语)