2024年3月17日发(作者:)
如何从图片中提取文字
如何从图片中提取文字2011-05-19 13:30
现在许多网站都有电子书下载,常见的格式有exe、chm、pdf等。为了保
护作者的权益,这些电子书可以看,但是其中的内容却不能进行复制,因为它
就像一幅图片一样。如果我们需要使用这些资料中的文本内容的话,是不是就
一定要重新输入一遍呢?当然不用这么麻烦。下面就为大家介绍将这些内容从资
料中提取出来的方法。
用SnagIt工具进行文字提取。
SnagIt是一款功能强大的图片捕捉工具,但是很多朋友可能不知道,它还
有文字捕捉的功能,能将文字从图片中提取出来。
SnagIt(屏幕捕捉程序)v8.1汉化绿色版:
SnagIt当前版本为7.02,大小为8903KB,下载地址可以在找到,汉化补
丁可以在找到。
启动SnagIt,选择菜单"输入/区域",选择菜单"工具/文字捕获",然后我
们打开要捕捉的文件窗口,按下捕捉快捷键,选定捕捉区域即可捕捉到文字。
在左侧选中"窗口文字"(如图),在左侧选择输入位置(比如屏幕、区域、窗口
等),输出位置(比如打印机、剪贴板、文件等)。设置完成后,.回到要捕捉文
字的文件窗口,按下"捕获"快捷键,即可将文字提取出来。
接着用相应工具重排文字。此时我们发现提取的文字可能会有很多空格或
段落错乱等现象,而且字号、字体等不合自己的心意。这时我们可以用熟悉的
WPS或Word软件进行重新编排。我们以WPSOffice2003为例看看如何对付提取
后文章的编排:用WPSOffice2003打开提取文章;然后选择"工具"菜单下的"文
字"/"段落重排",这时你会看到提取文章重新进行排版;接下来选择"工具"菜
单下的"文字"/"删除段首空格"命令,使得文章的每段参差不齐的行首空格被删
除;再选择"工具"菜单下的"文字"/"增加段首空格",文章变为正常的书写格式;
提取文章一般都留有空段,为删除这些空段,继续选择"工具"菜单下的"文字
"/"删除空段"命令,这时文章完全变为我们所要的形式;用你熟悉的界面任意
编辑文章吧。
用Office 2003提取图片中的文字
后,保存为.jpg格式
[图3]保存后的.jpg图片
图1、图2、图3是假设在浏览网页时,遇到含有文字的图片,利用腾讯
TT截图功能,在Photoshop粘贴生成.jpg文件;当然,也可以使用键盘上的
PrintScan键截图后,打开附件里的画图,进行粘贴生成.jpg文件。
2."尚书六号"的界面
3.导入需要提取的图片
[图5]点击"文件",选择"打开图象页"
[图6]选择刚才保存的并点击"打开"
[图7]"尚书六号"自动识别的三个选框
4.提取文字并保存文本
[图8]不修改默认设置,直接点击"识别"后,弹出的界面
[图9]将框内的文字选中,并复制到文本文件或Word文档进行个别错字修
正
Free-ORC
是一个非常好的免费在线服务,可以讲图片或者PDF中的文字提取出来,
支持的文件有PDF,JPG,GIF,TIFF,BMP or PNG,可以识别出6种文字:
English,German,french,Italian,Dutch and Spanish(英语,德语,法语,荷
兰语和西班牙语)


发布评论