2024年3月15日发(作者:)

OFFICE2003里面有自带OCR软件

各种格式文件ocr成word文件的方法

你还在为不同格式的文件怎么变成word文件发愁吗?各种识别软件各有缺陷,识

别效率低,让你痛苦不堪,有的只能识别字,对表格和图形无能为力,识别完了,

版面乱七八糟,无法使用。现在好了,本文针对各种情况下文字识别进行总结,帮

助大家掌握正确方法,节省时间,本文给出了所有情况下全文件表格、图形、文字

识别的完美解决方案:

1、PDF文件的识别:

1)文件可以直接识别的(以文本形式保存的PDF文件):安装acrobat 7专业版,

注意不是acrobat reader(下载

/soft/4/136/2006/Soft_),直接另存为rtf

文件(识别整个文件),或者选择工具栏上的文字选择按钮,然后选择文字区域,

然后复制到word等中。

2)文件不能直接识别的(以图片形式保存的PDF文件):安装office2003(下载

/soft/188/215/2006/Soft_ ),并装上

office工具Microsoft Office Document Imaging(完全安装此工具),然后在打

印机里面会增加Microsoft Office Document Image Writer打印机,然后将PDF

文件打印到此打印机,选择打印形成的文件的保存位置,然后会自动形成一个MDI

文件,并且自动用Microsoft Office Document Image打开此文件,然后选择“工

具”菜单下的“使用ocr识别文本”,识别完成后,在选择“工具”下的,“将文

本发送到word”,最后将把整个PDF文件识别输出到word文件中。

注意:Microsoft Office Document Image可以非常准确的全文件识别转化中文、

英文、表格,但是无法将图形输出到word,而是把文件中的所有图形单独形成一

个个独立的图片文件,放在相同位置的一个相同名称的文件夹中,因此可用snagit

软件将图形打开,然后复制到word中。(所有的识别软件都不能很好的处理图形

的识别问题,Microsoft Office Document Image的这种处理方法已经是非常好的

解决这个问题了。)