2024年3月30日发(作者:)
怎么把pdf转成word
江苏华电 王涛
近期,公司有不少同事都问有什么方法可以把pdf文件,转换成word格式,进行文
档编辑,因为之前我也没有接触过此类的转换,所以就通过查询资料,总结出以下方法:
1、实现工具:Office 2003中自带的Microsoft Office Document Imaging.
使用方法: 第一步:首先使用Adobe Reader打开待转换的pdf文件,接下来选择
“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为
“Microsoft Office Document Image Writer”,确认后将该pdf文件输出为mdi格式
的虚拟打印文件。
第二步:运行Microsoft Office Document Imaging,并利用它来打开刚才保存的
mdi文件,选择“工具→将文本发送到Word”菜单,并在弹出的窗口中勾选“在输出时
保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行ocr。这可能需要
一些时间”,不管它,确认即可。 提示:目前,包括此工具在内的所有软件对pdf转doc
的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还需要
手工对其进行后期排版和校对工作。
2、利用Office 2003中的Microsoft Office Document Imaging组件来实现pdf
转word文档在一定程度上的确可以实现pdf文档到word文档的转换,但是对于很多“不
规则”的pdf文档来说,利用上面的方法转换出来的Word文档中常常是乱码一片。为了
恢复pdf的原貌,这种软件可以很好地实现版式的完全保留,无需调整,而且可以调整成
需要的样板形式。实现工具:Solid Converter pdf。
使用方法:
1、下载安装文件Solid Converter pdf,点击安装。提示:安装前有个下载安装插件的
过程,因此需要保证网络连接通畅。
2、运行软件,按工具栏要求选择需要转换的pdf文档,点击右下的“转换”(Convert)
按扭,选择自己需要的版式,根据提示完成转换。
缘由就不说了,因为word可以进行随意的复制及规则的格式修整,而pdf就没这么
方便了。(虽然pdf确实是非常伟大的发明创造,Adobe的产品都很牛) 一般的,pdf转
word方法有很多。 第一法: 最普通的方法就是打开pdf之后通过“文件”下拉菜单“另
存为.doc”文档,不过此法因为过于简单而使得成品word效果很差,这也是符合马克思
主义哲学观点的,世界上本就没有这么简单的事情,呵呵。呵呵。 因为直接转换的效果取
决于pdf文件的清晰度,极少数的文件可以尝试本法。 第二法: 借助软件到达转换目的。
如果找到通过软件能顺利转换成word的,那么恭喜各位,你们的运气还是不错的。因为,
自动的总比手工的利索省事。 第三法: 尝试软件所生成的word,里面没有一个文字,
只有一张张的截图。 如果从pdf中一行行的选取文字,再复制到word,不仅有乱码,而
且一段段的重复,容易使人崩溃。建议如果是期刊类的文献,可以根据论文的题目再去数
据库搜索一遍,下载CAJ的格式,因为CAJ的文件几乎都能非常清晰地另存为.txt文件。
而pdf格式经无数次实验,远不及CAJ来得实用。CAJ转换为.txt之后如图所示。此时,
需要从头检查到结尾,删除原文档中的页眉,页码等。否则当全选文字复制到word中时,
容易产生歧义。这些工作做好之后,就是对word里文字的排版工作了。不过,从.txt里
复制过来的文档,会有很多的回车键存在,曾经非常痛苦地一个个地删除……相信很多同事
和我有过一样的经历,后来,发现可以采用宏的方法进行操作,也可以采用替换字符的方
法。 宏: 步骤如下 1、打开Word,依次单击工具→宏→Visual Basic编辑器,打开
Microsfot Visual Basic窗口,将宏代码复制粘贴过去。保存。关闭此窗口。提示:宏代码
常常是以Sub开头,且以End Sub结尾的。注意复制代码的时候不要遗漏。代码: Sub 删
除回车() ‘ 删除选中部分的回车 Macro ormatting
=“^p”.Repla
“”.Forward===ase=Fals
holeWord=yte=llWordForms=ou
ndsLike=ildcards=uzzy=
ecuteReplace:=wdReplaceAllEndSub 2、现在已经回到Word窗口,单击工具→自定义,
单击“命令”选项卡,在左侧的类别中单击 “宏”,此时在右侧的“命令”框中可以看到
“ros.宏的名称”,左键拖动它到工具栏你想要的位置。接着右键单击
它,在第3行“命令”后面可以为它改个你喜欢的名字,改好后按一下ENTER。再右键单
击它,可以更改按钮图像,选择一个你喜欢的图标。完成后就可以关闭自定义对话框了。3、
完成。替换字符:回车键的对应字符为“^p”,选中需要删除回车的文字,替换为“空”
就行了。不过,因为回车键是段落之间的标致,所以全部的回车删除也意味着段落的消失,
当你使用了全文宏之后,你发现你的word里只剩下了长长的一段。那个迷茫,那个迷失……
经过无数次的实战,终于摸索出星火燎原的道路来:在使用回车宏之前,在每段的前几个
字符前预先加红。这样,就能在所有的文字变成以一段之后,迅速果断地敲击出新的回车
来。之后: 经过此番曲折,图片般的文字终于变成了触手可及的一个个活蹦乱跳的字符了,
成就感啊。 第四法: 当然,还剩下最后一个方法,那就是CAJ也无法另存为txt文件的,
那么,就用尚书的汉字识别吧,不过识别率一般般,而且乱码的几率也非常的大。希望以
上方法可以帮到大家,谢谢!

发布评论