2024年4月4日发(作者:)

工具软件 汉王 PDF OCR 8.1.0.3

汉王PDF OCR是一款非常实用的PDF编辑工具,可以把PDF文件(包括其

中的文本和图片)转化为可编辑的文档,如WORD、TXT和HTML文档。该软件

具有以下特点:

 具有识别正确率高、速度快的特点。

 有批量处理功能,避免了单页处理的麻烦。

 支持处理灰度、彩色、黑白三种色彩的BMP、TIF、JPG、PDF等多种格

式的图像文件。

 可识别简体、繁体和英文三种语言。

 具有简单易用的表格识别功能。

 具有TXT、RTF、HTML和XLS多种输出格式,并有所见即所得的版面还

原功能。

 新增打开与识别PDF文件功能,支持文字型PDF的直接转换和图像型P

DF的OCR识别。

安装该软件后,双击桌面上的图标,弹出【汉王PDF OCR】窗口。在该窗口

中主要包含有菜单栏、工具栏、文本窗格、横校窗格、视图窗格和图像文件管理

窗格等,如图3-9所示。

菜单栏

工具栏

文本窗格

横校窗格

图像文件管理窗格

视图窗格

图3-9 【汉王PDF OCR】窗口

该窗口中除了常见的菜单栏、工具栏、【图像文件管理】窗格外,在窗口的右

侧还有一个【横校】窗格,其中包含三个控制窗口的按钮。通过单击这些按钮,

可以调整【文本】窗格的结构和布局。

使用该软件打开PDF文档,不仅可以修改文档中的文本内容,而且还可以将

其转化为可编辑的文档格式。具体操作如下:

(1)在【汉王PDF OCR】窗口中,单击工具栏中【打开图像】按钮,选

择需要打开的pdf文件。然后单击【打开】按钮后,在弹出的对话框中单击【确

定】按钮,打开该PDF文档的所有页面,如图3-10所示。

单击

图3-10 打开PDF文件

(2)单击工具栏中【选择全部文件】按钮

窗格中的全部文件,如图3-11所示。

,即可选择【图像文件管理】

单击

全选文件

图3-11 全选文件

(3)继续单击【开始识别】按钮

打开【批处理识别】对话框。在该对话框中

对所选择的文件逐一进行分析识别,如图3-12所示。

单击

正在识别

图3-12 识别文件

(4)选择【图像文件管理】窗格中第一个文件。然后,在【文本】窗格中

分别将“休养”改为“修养”;“原量”改为“原谅”,如图3-13所示。

选择

修改

修改

图3-13 修改错别字

(5)使用相同的方法,选择第7个文件,并在【文本】窗格中将“惨悔”

改为“忏悔”,如图3-14所示。

选择

修改

图3-14 修改错别字

(6)执行【输出】|【指定格式文件】命令,在弹出的【保存识别结果】对

话框中,输入文件名称并在【保存类型】下拉列表中选择【HTML(*.HTM)】选

项。然后,单击【保存】按钮,如图3-15所示。

执行

输入

单击

选择

图3-15 另存为HTML格式