2024年4月4日发(作者:)
工具软件 汉王 PDF OCR 8.1.0.3
汉王PDF OCR是一款非常实用的PDF编辑工具,可以把PDF文件(包括其
中的文本和图片)转化为可编辑的文档,如WORD、TXT和HTML文档。该软件
具有以下特点:
具有识别正确率高、速度快的特点。
有批量处理功能,避免了单页处理的麻烦。
支持处理灰度、彩色、黑白三种色彩的BMP、TIF、JPG、PDF等多种格
式的图像文件。
可识别简体、繁体和英文三种语言。
具有简单易用的表格识别功能。
具有TXT、RTF、HTML和XLS多种输出格式,并有所见即所得的版面还
原功能。
新增打开与识别PDF文件功能,支持文字型PDF的直接转换和图像型P
DF的OCR识别。
安装该软件后,双击桌面上的图标,弹出【汉王PDF OCR】窗口。在该窗口
中主要包含有菜单栏、工具栏、文本窗格、横校窗格、视图窗格和图像文件管理
窗格等,如图3-9所示。
菜单栏
工具栏
文本窗格
横校窗格
图像文件管理窗格
视图窗格
图3-9 【汉王PDF OCR】窗口
该窗口中除了常见的菜单栏、工具栏、【图像文件管理】窗格外,在窗口的右
侧还有一个【横校】窗格,其中包含三个控制窗口的按钮。通过单击这些按钮,
可以调整【文本】窗格的结构和布局。
使用该软件打开PDF文档,不仅可以修改文档中的文本内容,而且还可以将
其转化为可编辑的文档格式。具体操作如下:
(1)在【汉王PDF OCR】窗口中,单击工具栏中【打开图像】按钮,选
择需要打开的pdf文件。然后单击【打开】按钮后,在弹出的对话框中单击【确
定】按钮,打开该PDF文档的所有页面,如图3-10所示。
单击
图3-10 打开PDF文件
(2)单击工具栏中【选择全部文件】按钮
窗格中的全部文件,如图3-11所示。
,即可选择【图像文件管理】
单击
全选文件
图3-11 全选文件
(3)继续单击【开始识别】按钮
,
打开【批处理识别】对话框。在该对话框中
对所选择的文件逐一进行分析识别,如图3-12所示。
单击
正在识别
图3-12 识别文件
(4)选择【图像文件管理】窗格中第一个文件。然后,在【文本】窗格中
分别将“休养”改为“修养”;“原量”改为“原谅”,如图3-13所示。
选择
修改
修改
图3-13 修改错别字
(5)使用相同的方法,选择第7个文件,并在【文本】窗格中将“惨悔”
改为“忏悔”,如图3-14所示。
选择
修改
图3-14 修改错别字
(6)执行【输出】|【指定格式文件】命令,在弹出的【保存识别结果】对
话框中,输入文件名称并在【保存类型】下拉列表中选择【HTML(*.HTM)】选
项。然后,单击【保存】按钮,如图3-15所示。
执行
输入
单击
选择
图3-15 另存为HTML格式


发布评论