2023年12月6日发(作者:)
利用Microsoft Office Document Imaging把PDF转化成word文档
要把PDF文件转化为word文档,前提条件是先安装虚拟打印机。具体方法为:在网上找一个完整版office2003安装到你的电脑中(一定要完整版的,否则完成不了下面的步骤),安装完成后,你的电脑中就自动装上了office的工具---Microsoft Office Document
Imaging(文档成像),同时在打印机里面会自动增加Microsoft
Office Document Image Writer打印机(是一个虚拟打印机)。
这时开始转化的第一步:把PDF文件用虚拟打印机转化成图形文件(MDI文件),具体方法为:打开要转化的PDF文件---点击“打印”----在打印机中选择“Microsoft Office Document Image Writer”------选择打印形成的文件的保存位置,然后会自动形成一个MDI文件,并且会自动用Microsoft Office Document Image工具打开此文件。
转化的第二步:对MDI文件进行识别后,输出到word文件中。具体方法为:在打开的MDI文件中,选择“工具”菜单下的“使用ocr识别文本”,识别完成后,再选择“工具”菜单下的“将文本发送到Word”,这时会形成并自动打开一个htm文档,即网页文件,可以把文件“另存为”doc文件,这时整个转化过程就结束了。
注1:Microsoft Office Document Image对都是文字的word文档识别和转化率比较高,尽管它和所有的识别软件一样都不能对PDF中的图形进行很好的处理,但它能对表格等图形进行识别,只是无法将图形直接输出到Word,而是把文件中的所有图形单独形成一个个独立的图片文件,放在相同位置的一个相同名称的文件夹中,我们可以用snagit软件(捕捉图形的软件)将图形打开,然后将图形复制到Word中。
注2:加密的PDF文件:先下载解密软件,解密后在参看1),2)
注3:繁体PDF文件:用正常方法把PDF识别到Word后,用Word中的“工具”--“语言”---“中文繁简转换”把繁体字转化为中文就可以了。


发布评论