2024年3月15日发(作者:)
OFFICE2003里面有自带OCR软件
各种格式文件ocr成word文件的方法
你还在为不同格式的文件怎么变成word文件发愁吗?各种识别软件各有缺陷,识
别效率低,让你痛苦不堪,有的只能识别字,对表格和图形无能为力,识别完了,
版面乱七八糟,无法使用。现在好了,本文针对各种情况下文字识别进行总结,帮
助大家掌握正确方法,节省时间,本文给出了所有情况下全文件表格、图形、文字
识别的完美解决方案:
1、PDF文件的识别:
1)文件可以直接识别的(以文本形式保存的PDF文件):安装acrobat 7专业版,
注意不是acrobat reader(下载
/soft/4/136/2006/Soft_),直接另存为rtf
文件(识别整个文件),或者选择工具栏上的文字选择按钮,然后选择文字区域,
然后复制到word等中。
2)文件不能直接识别的(以图片形式保存的PDF文件):安装office2003(下载
/soft/188/215/2006/Soft_ ),并装上
office工具Microsoft Office Document Imaging(完全安装此工具),然后在打
印机里面会增加Microsoft Office Document Image Writer打印机,然后将PDF
文件打印到此打印机,选择打印形成的文件的保存位置,然后会自动形成一个MDI
文件,并且自动用Microsoft Office Document Image打开此文件,然后选择“工
具”菜单下的“使用ocr识别文本”,识别完成后,在选择“工具”下的,“将文
本发送到word”,最后将把整个PDF文件识别输出到word文件中。
注意:Microsoft Office Document Image可以非常准确的全文件识别转化中文、
英文、表格,但是无法将图形输出到word,而是把文件中的所有图形单独形成一
个个独立的图片文件,放在相同位置的一个相同名称的文件夹中,因此可用snagit
软件将图形打开,然后复制到word中。(所有的识别软件都不能很好的处理图形
的识别问题,Microsoft Office Document Image的这种处理方法已经是非常好的
解决这个问题了。)


发布评论