2024年3月30日发(作者:)

各种格式文件转换成word文件的方法

你还在为不同格式的文件怎么变成word文件发愁吗?各种识别软件各有缺陷,识别

效率低,让你痛苦不堪,有的只能识别字,对表格和图形无能为力,识别完了,版面乱七

八糟,无法使用。现在好了,本文针对各种情况下文字识别进行总结,帮助大家掌握正确

方法,节省时间,本文给出了所有情况下全文件表格、图形、文字识别的完美解决方案:

1、PDF文件的识别:

1)文件可以直接识别的(以文本形式保存的PDF文件):安装acrobat 5 专业版,注

意不是acrobat reader,直接另存为rtf文件(识别整个文件),或者选择工具栏上的文字

选择按钮,然后选择文字区域,然后复制到word等中。

2)文件不能直接识别的(以图片形式保存的PDF文件):安装office2003,并装上

office工具Microsoft Office Document Imaging(完全安装此工具),然后在打印机里

面会增加Microsoft Office Document Image Writer打印机,然后将PDF文件打印到此

打印机,选择打印形成的文件的保存位置,然后会自动形成一个MDI文件,并且自动用

Microsoft Office Document Image打开此文件,然后选择“工具”菜单下的“使用ocr

识别文本”,识别完成后,在选择“工具”下的,“将文本发送到word”,最后将把整

个PDF文件识别输出到word文件中。

注意:Microsoft Office Document Image可以非常准确的全文件识别转化中文、英

文、表格,但是无法将图形输出到word,而是把文件中的所有图形单独形成一个个独立

的图片文件,放在相同位置的一个相同名称的文件夹中,因此可用snagit软件将图形打开,

然后复制到word中。(所有的识别软件都不能很好的处理图形的识别问题,

Microsoft Office Document Image的这种处理方法已经是非常好的解决这个问题了。)

3)加密的Pdf文件:先下载解密软件,解密后在参看1),2)

4)繁体pdf文件:用2)的方法识别到word后,用word中的“工具”--“语言”

---“中文繁简转换”

2、caj文件的识别:

1)局部文字识别:直接使用caj浏览器的ocr

2)全文件识别:打印到Microsoft Office Document Image Writer打印机,后面

和上面的2)操作一样

3)博硕论文全文下载:在线阅读博硕论文,待可以看到最后一页后,不要关闭caj浏

览器,到caj安装目录下cache中找到一个较大的文件,拷贝到其他位置即可。然后使用

2)全部转化为word。

3、超星文件的识别:

1)局部文字识别:直接使用超星浏览器的ocr

2)全文件识别:打印到Microsoft Office Document Image Writer打印机,后面

和上面的2)操作一样,要注意的是,超星打印功能有点区别,因为超星是目录和全文分开

的,所以打印时,需要分别把目录和正文识别到word中,在合并到一起。打印时要填入

打印页码从1到最后一页,不要选择打印全部。此外在打印选项中,还要将页面比例设成