2024年5月31日发(作者:)
Office2003实现PDF文件转Word文档
Office2003实现PDF文件转Word文档
经过本人尝试,发现可以利用Office 2003中的Microsoft Office Document Imaging组件来实现PDF
转WORD文档,也就是说利用WORD来完成该任务。方法如下:
用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打
印机”栏中的名称设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为
MDI格式的虚拟打印文件。
注:如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添
加/删除组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。
然后,运行“Microsoft Office Document Imaging”,并利用它来打开刚才保存的MDI文件,选择“工
具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示
“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。
注:对PDF转DOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其
进行排版和校对工作。
以上仅在word2003中可用,其他版本没有Microsoft Office Document Image Writer。
PDF 文件处理
1. 问:PDF 与WORD 之间如何通过软件实现格式转换 答:PDF—>DOC 使用软
件Acrobat,pdf2word;DOC—>PDF 使用软件Acrobatpdf->Tiff(JPEG,PNG)
->OCR 输出word,效果极佳,如果是English几乎不用怎么修改就可
以用了.推荐OCR 软件:ABBYY FineReader 7.0;ScanSoft OmniPage Pro
14.0(最强
2. 问:如何把WORD 文档转换成PDF 答:安装Acrobat(不只是Reader)完
全版,在安装选项里有的,把这一项选上,选pdfmaker.在word 的工具条
上会有一个转换按钮.装好之后在WORD 的工具栏里面会有Adobe PDF,下拉
菜单里面会有convert to Adobe PDF,按那个就行了.在控制面板里的打印
机里多了两个关于Acrobat 的,说明可以了.装了Acrobat 的话,默认会装
一个distiller,你也可以装acrobat 里面的pdfwriter,它们两个都会成为
虚拟的打印机的.然后在Word 里,File->Print 选择刚过装好的虚拟打印机
就可以了.
3. 问:如何将PDF 文档直接转为WORD 除了ACROBAT 还有其它软件工具吗,用
这个图片走样很厉害答:使用pdf2word,pdffactory 这些软件可以实现
4. 问:DOC 转换成PDF 时,图很不清楚,怎么办 论文的提交的格式是DOC,
但 在DOC 转PDF 时,图很不清楚.答:不要用pdfwriter,用distiller 可能
会好一些.或者用Letex,图的清晰度损失不大
5. 问:很多用VISIO 画的图,插入在WORD 文档里面的,怎么专成PDF 以后,
图
里面的字母位置变了 而且变的很夸张,满屏幕乱窜,这个问题怎么办啊
答:Word 中所有图片都变成tif 格式的.其他的一律事先转成tif,压缩的,
这样文件也不大.或者变成BMP 位图也可以,但图片容量比较大.
6. 问:我想把PDF 格式文档直接转成DOC(就是WORD 文档)或者TXT(纯文本
文档),可以吗 答:PDF 格式的文档是不能直接转换成DOC(WORD 文档)
的,但是可以先转换成RTF 格式,然后再转成DOC 格式,前提是该PDF 文档
必须是纯英文的,中文的PDF 转换之后会出现乱码.此时,需要用到一个工
具:Aerial,这个工具是Acrobat 的一个插件,可以用来把PDF 文档转换成
RTF 文档.原PDF 文档可以包含图片,图片能正常转换到RTF 文档中.如果
只需转换成TXT 文档,那么直接转换就可以了(图片就没了).
7. 问:PDF 文件中的文字怎么转换成WORD 答:如果是文本的,可以用Acroba
t 选中文字功能,如果是图片格式的,可以用最新豪华版的维普的OCR 功能,
但是要自己改错字.
8. 问:我的PDF 转WORD 的时候怎么排版变了 答:有些地方没有用固定的东
"在经济学的边缘上" 网站欢迎你!
/web/fanyq 2
西 固定,比如分页符,软回车,图片不统一也很有可能排版变掉
9. 问:PDF 转换成WORD,提示PDF 有密码,怎么办呢 答:找一个PDF 密码破
解器,破解后,再转换就可以了.比如Advanced pdf Password Recovery;
pdf Password Remover;;Advanced Password Recove
ry5.3.后者是一个各种破解的集成,里面的Acrobat 是针对PDF 的.
10. 问:PDF 文件到TXT 文件的转换,除了copy 和paste 得方法外,还有什
么办法吗 答:将WORD 转为PDF,然后用方法2 另存为rtf 文件,WORD 可以
识别.但是一般的下载文献,因为本身是图形,所以第二种方法不能实现.
以上所说的是针对中文文本.PDF-—>WORD 方法总结如下:●如果PDF 本身
就是图形的话处理方法如下:(1)英文处理方法:A,用photoshop6.0 打
开PDF 将之转化为tif 格式文件.B,用Omnipagepro10.0 打开tif 文件,识别.这个东东识别准确率极
高.
(2)中文处理方法:A,用photoshop 打开PDF 将之转化为tif 格式文件.B,
用th-ocr2000 专业版或者Shocr6.0 打开tif 文件,识别.●如果PDF 本身
是文本的话处理方法如下:(1)使用BCL 公司的drake 软件(Acrobat 的插
件)转换.使用第一种方法转换成的rtf 文件格式比较乱,不过可以直接拷
贝出其中的图形.使用的二种方法转换成的rtf 文件格式遵循原文,不过不
能拷贝原文中的图形.
11. 问:为什么我的PDF 文档不能选取文字内容或者存为rtf 或者txt 答:
如果不属于这种情况,很可能是因为这个文档中的所谓的文字是从图像文件
(比如扫描仪得到的结果)打印出来的.这种情况下是肯定不能直接选取文
本的.顺便说一下,在Acrobat 6.0 中是另存为WORD 文档.解决办法:使用


发布评论